「第42回サイバーワールド(CW)研究会」に参加してきたよ。~データの社会活用のためのセマンティックウェブ技術編~

こんにちは!技術部のツカサです。

部長の勧めで「第42回サイバーワールド(CW)研究会」に参加してきました。
午後を丸々使った濃ゆい発表会だったのでセッションごとに全三回に分けて記事を書いていきます。

第一回はこの記事
第二回はこちら
第三回はこちら

今回のテーマは「デジタルトランスフォーメーション(DX)とサイバーワールド」について有識者の方々に語っていただきました。
DXは技術者だけではなく色んな業種・立場の方が考える必要のある事柄になります。

  • DXとは(Wikipedia抜粋)

デジタルトランスフォーメーション(Digital transformation; DX)とは、「ITの浸透が、人々の生活をあらゆる面でより良い方向に変化させる」という概念である。2004年にスウェーデンのウメオ大学のエリック・ストルターマン教授が提唱したとされる。ビジネス用語としては定義・解釈が多義的ではあるものの、おおむね「企業がテクノロジーを利用して事業の業績や対象範囲を根底から変化させる」という意味合いで用いられる。

キーワードとしては知っていましたしネット上の記事も読んでおりましたがDXに向けてどんな研究が進んでいて国がどんなことを考えているのかお聞きできる貴重な機会でした。

イベント情報

イベントの主催はサイバーワールド研究会様常設されている研究会ではなく、毎年更新しながら活動している研究会になります。少人数で議論を重視しており、行政・企業の学術をフォーカスして運営されています。

年に3回ほどは今回のような発表の場を設けておりますのでご興味ある方は参加されてはいかがでしょうか。

電子情報通信学会 研究会発表申込システム研究会 開催スケジュール


発表1:データの社会活用のためのセマンティックウェブ技術

発表者

武田 英明 様
国立情報学研究所
情報学プリンシプル研究系
教授

発表レポート

データがあっても繋がらない

日本語というのは難しいもので私達が何気なく飲んでいる「牛乳」一つとっても様々な呼び方があります。
「牛乳」「ミルク」「精製牛乳」etc…

指し示すものは一つなのに言葉が違う・・そこでデータを意味で繋ぐための技術がセマンティックWEBと呼ばれるものになります。

セマンティックWEB

  • セマンティックWEBとは(Wikipedia抜粋)

W3C のティム・バーナーズ=リーによって提唱された、ウェブページの意味を扱うことを可能とする標準やツール群の開発によってワールド・ワイド・ウェブの利便性を向上させるプロジェクト。セマンティック・ウェブの目的はウェブページの閲覧という行為に、データの交換の側面に加えて意味の疎通を付け加えることにある。

セマンティックWEBに付随して大事なものが共通語彙基盤(IMI)という考え方、IMIは電子行政分野におけるオープンな利用環境整備に向けた政府のアクションプランの一環であり、データに用いる文字や用語を共通化することによって情報の共有/活用を円滑に行うことを目的としております。
詳しくは[PDF]世界最先端IT国家創造宣言・官民データ活用推進基本計画についてを御覧ください。

難しい感じがしますが要するに言葉の意味が定義されている辞書のようなものです。
日本語を使用するシステムを作成する際にこの辞書を全員が使えば、どこに行っても「ミルク」や「生乳」の言葉は牛乳を指し示すと機械が理解してくれるようになります。

共有語彙基盤(IMI)

辞書には「概念辞書」と「構造化辞書」の2つがあります。

  • 概念辞書
    • 概念の表記としての用語
      各項目は概念であって用語ではない
  • 構造化辞書
    • 概念は相互に繋がっていて、構造で意味を表現

ss_NoName_2019-7-1_11-46-15_No-00

用語はさらに2つの使い分けがあり

  • クラス用語(クラス概念)
    • ある事柄を表現する用語、自身の名前とプロパティ用語を構成要素として持つ
  • プロパティ用語(関係概念)
    • 事柄の性質や属性を表現する用語及び事柄と事柄の関係を表現する。自身の名前と使われる用語(クラス用語)、指し示すもの(クラス用語又は値の型)から構成される

クラス用語

ss_NoName_2019-7-1_11-50-41_No-00

プロパティ用語

ss_NoName_2019-7-1_11-51-7_No-00

用語の構造

ss_NoName_2019-7-1_11-53-51_No-00

このように構造化された語彙の辞書が作成されている。

今の日本国では業種ごとに専門用語があり、それらを全て共通語彙基盤とすることは難しい。
そのため全ての業種/国民が普遍的に利用できるコアな語彙を策定し、それぞれの業種が自由に作成・アップデートできるドメイン語彙に分けて管理することを武田氏は推奨しておりました。

コア語彙

コア語彙としてはIMIのサイトで共通語彙基盤 コア語彙2.4.2(2019/07/01時点)が公開されています。
現在も管理/改善が行われており、様々な視点から意見がほしいとおっしゃられておりました。

ドメイン語彙

業種ごとに用意される語彙でこちらは各業種が手を上げ作成/共有すべき語彙になります。
果たして最初にナプキンを手に取るのはどの企業になるのでしょうか。

まとめ

武田氏は共通語彙基盤に付随して農作物語彙も作成されております。
語彙作成のプロセス等もご紹介頂き共通語彙基盤の普及に尽力されておりました。

共通語彙基盤の普及が進み業種を問わずデータを意味で捉えれる社会になればデータ連携がよりスムーズに進みIT活用、引いては日本全体のDX化に繋がることとなるでしょう。

>> 雑誌等の執筆依頼を受付しております。
   ご希望の方はお気軽にお問い合わせください!

ご覧いただきありがとうございます! この投稿はお役に立ちましたか?

役に立った 役に立たなかった

0人がこの投稿は役に立ったと言っています。

コメント投稿

メールアドレスは表示されません。


*