IMI

c94f5e44a3ee5722b88f4e1ed88fbb1c_s_R

IMI

IMIは「Infrastructure for Multilayer Interoperability」の略称で、共通語彙基盤と言われています。

データ駆動型社会では、データ間に相互運用性(interoperability)が求められます。ファイル形式やフォーマット形式だけでなく、データに用いる文字や用語の「意味」のレベルにおいても相互運用性が重要となってきます。同じ事柄に対する用語が日本語では特にいろいろな表現がなされます。例えば「融資」と「貸付」、「企業」「法人」「会社」、「住所」「所在地」「居住地」など、いずれも同じような意味ですが、機械によるデータ処理においてはこれらが区別されてしまいます。これではせっかくのデータも活用しにくくなります。

そこで、用語の表記や構造が異なっていても、それが同じ意味の用語として解釈できるようにさまざまな分野で利用される用語の表記・意味・データ構造を統一し、「意味」のレベルでの相互運用可能性が担保される環境を提供する仕組みがIMIです。情報処理推進機構(IPA)が構築を進めています。

IPAの「共通語彙基盤概要(https://imi.ipa.go.jp/doc/IMI_Overview_v2.pdf)」はIMIを「分野を超えた情報交換を行うためのフレームワーク」と説明しています。

(参考資料)

・IMI共通語彙基盤入門 2017年12月27日 ワーキングドラフト

・データ標準の社会全体への展開について 平成29年12月1日 デジタル・ガバメント技術検討会議 データ・タスクフォース

共通語彙基盤

共通語彙基盤は、コア語彙とドメイン語彙と呼ばれる2つの語彙で構成されています。人名や組織名や住所など、ほとんどのシステムで必須の共通して使う「コア語彙」、複数の分野(ドメイン)で共通して使われる「ドメイン共通語彙」、特定の分野でしか使われない「ドメイン固有語彙」の3階層からなり、コア語彙を中心としたドーナッツ型の構成で表現されています。

interoperability_001_R(データ連携基盤の構築について 平成30年4月2日 内閣府 政策統括官(科学技術・イノベーション担当)https://www.kantei.go.jp/jp/singi/titeki2/tyousakai/kensho_hyoka_kikaku/2018/sangyou/dai5/sankou3.pdf より)

ここでの「語彙」とは、一般的な言葉や単語ではなく、IMIのWebサイトには次のように記されています。

共通語彙基盤における「語彙」とは、・・・・ファイルやインターネットなどを介して行われるコンピューター間のデータ通信を円滑かつ確実に行うことを目的として、概念の代表的な表記としての一つの語の意味や構造、そのような語によって表される概念と他の概念の関係などを明確にした概念の集合を指して用います。

(https://imi.go.jp/goi/goi-about.html より)

また、語彙の整備には、諸外国の先進事例としてアメリカのNIEM(National Information Exchange Model)や欧州のJoinupとの整合性を図るとともに、W3C、UN/CEFACT、Dublin Core 等の枠組みを参照しながら整備が進められているそうです。

IMIの特徴

前述の「データ連携基盤の構築について 平成30年4月2日 内閣府 政策統括官(科学技術・イノベーション担当)」では、IMIの特徴として次のことが記されています。

・分野横断(社会基盤のコアな情報を重点推進)

・グローバル連携(EU、米国との情報交換)

・IoTへの配慮(将来的な連携を視野に入れて設計)

・オープンデータでの活用(社会全体のデータ利活用を促進)

・検索性向上への配慮(検索サービス標準の参照)

・既存システムへの配慮(既存データを活かしデータ連携時に活用)

(データ連携基盤の構築について 平成30年4月2日 内閣府 政策統括官(科学技術・イノベーション担当)https://www.kantei.go.jp/jp/singi/titeki2/tyousakai/kensho_hyoka_kikaku/2018/sangyou/dai5/sankou3.pdf より)

NIEM

IMI共通語彙基盤の開発は、アメリカのNIEMを参考に進められ、コア語彙とドメイン語彙という構成はNIEMを習ったもののようです。

NIEM(National Information Exhcnage Model)は、9.11の同時爆破テロの時に組織横断で情報が共有できなかったことを教訓として、DHS(アメリカ合衆国国土安全保障省)が中心に整備している情報共有を円滑にするための連邦政府共通の情報モデルです。データフォーマットや統一ボキャブラリを整備しようというもので、司法省で作成していたGJXDM(Global Justice XML Data Model)を基礎としており、2017年ではNIEM 4.0が公開されています。

NIEMは、全ての分野に共通なコア語彙と各分野の語彙で構成されており、どこでも利用する共通語彙をNIEM Core、各分野ごとの共通語彙をNIEM Domainsと呼んでいます。様々な組織が持つデータ項目はそのままで各分野独自の語彙を定義しており、データ交換時に共通的なデータ項目に置き換えて情報交換や活用をします。安全保障、防災が中心となっていますが、現在は健康分野等にも展開しており、氏名や法人等、188のコア語彙を定義し14の分野を整備しています。

interoperability_002_R(NIEM  https://www.niem.gov/communities/niem-community より)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です