AlterEgo

d6c6ee289977e9a148340377f36cf2cc_s_R

AlterEgo

AlterEgoは日本語では別人格、分身、無二の親友といった意味があります。2018年4月4日のMITのニュースリリースでは、このAlterEgoと名付けられたちょっと変わったウェアラブルデバイスが紹介されています。

片耳から顎、そして口元にかけて装着するデバイスとコンピューティングシステムで構成されています。デバイスは16の電極を内蔵しており、顎や顔の神経筋信号を検出しニューラルネットワークを介して単語に変換することで音声認識を行うそうです。

デバイスには骨伝導ヘッドフォンが内蔵されているため、周囲の騒音・雑音に関係なくシステムと音声による情報のやり取りが可能とのことです。

よく似たものにBCI(Brain-computer Interface)があります。人間の脳波を解析し、外部機器をコントロールするあるいは、コンピュータからのデータを脳に送って双方向的な情報のやりとりを行うというものです。AlterEgoは脳波計などを使用する脳コンピューターインターフェイス(BCI)とは異なり、ユーザが内部的に発声している単語またはフレーズのときに生じる顔の下面および頸部の皮膚の表面からの電気的信号を読み取る仕組みで、口を動かす必要はないそうです。頭の中での音読、サブボーカリゼーション(subvocalization)を読み取るということなのでしょうか?

AlterEgoの特長

2018年3月に東京で開催された人工知能とヒューマンインタフェースに関するトップカンファレンスであるACM IUI 2018 (Annual meeting of the intelligent interfaces community )で、AlterEgoの論文が発表されていました。その論文では、下図のように電極が顔の各部へ伸びていて、日常的に使ってみたいと思えるような形ではなかったのですが、今回の発表ではすっきりとしたスマートな形になっています。

aAlterego_001_R(AlterEgo: A Personalized Wearable Silent Speech Interface  https://dam-prod.media.mit.edu/x/2018/03/23/p43-kapur_BRjFwE6.pdf より)

このデバイスは、脳の活動に直接的かつ物理的にアクセスするものではなく、顔及び声帯の筋肉から信号を読み取る仕組みであるためユーザの脳内での思考を読み取ることはできません。従って、ユーザのプライバシーが筒抜けになるという心配はないようです。

研究では語彙数は20程度と少ないものの加算・乗算問題やチェスでの駒の動きなど10人の被験者で実験し、平均で約92%の精度だったそうです。但し、個人に合わせるためのカスタマイズ時間を約15分間取っています。

aAlterego_002_R(AlterEgo: A Personalized Wearable Silent Speech Interface  https://dam-prod.media.mit.edu/x/2018/03/23/p43-kapur_BRjFwE6.pdf より)

AlterEgoの用途

AlterEgoが実用化された場合の用途としては、AlterEgoのWebサイトには、ブルートゥーススピーカーに接続することで、ユーザーが内部的にフレーズを発声し、フレーズを別の言語に翻訳する多言語会話、AIと接続することで医師の臨床的意思決定の手助け、ミーティングの分からない単語をシステムに定義を黙って聞く、誰かに会ったが名前が思い出せないときにアドレス帳をそっと調べるなどが挙げられています。また、言語障害を抱える人たちのコミュニケーションを助ける可能性もあげています。論文では、ユースケースの例としてショッピング中の合計の計算、IoTの制御装置、メディアの制御、電話の応答などが想定されているようです。ただ、商業化は時期尚早としています。

AlterEgoとBCI

AlterEgoに似たものとしては、Facebookの研究グループであるBuilding 8が2017年4月に開発計画を発表した「サイレント音声システム」があります。着用可能なウエアラブルセンサーで脳の信号を読み取り、1分間に100語の文字情報に変換するというものです。

日本でも脳活動から被験者が頭に思い描いていることをテキスト化する研究があります。NICT脳情報通信融合研究センター(CiNet)のグループは、映像を見て感じた「物体・動作・印象」の内容を、fMRI画像などの脳活動データから脳活動を読み解くことで、1万語の「名詞・動詞・形容詞」の形で言語化する脳情報デコーディング技術を開発しています。デコードとは暗号化・記号化された情報を元に戻すことで、脳情報デコーディング技術とは、画像や映像などから感じた内容を脳活動から解読する技術のことです。

これらはAlterEgoと似てはいますが、脳から直接情報を読み取る脳コンピューターインターフェイス(BCI)です。他にも、イーロン・マスク氏が立ち上げた「Neuralink(ニューラリンク)」、脳にセンサーを埋め込んでコンピュータとの通信を実現する米国防高等研究計画局(DARPA)の研究など数多くあります。

前述のNICT脳情報通信融合研究センター(CiNet)のグループの成果はすでに社会実装の段階にまで進んでいるようで、NTTデータ経営研究所では、TV CMや動画広告が人に与える知覚情報を定量的に評価する技術の開発で使用しているそうです。

AlterEgoのWebサイトでは、非侵襲的な脳コンピュータシステム(BCI)と比較しながら、こうしたシステムはシステム上は侵襲的ではないが、脳活動に直接アクセスできるという点で侵害的であり、日々使うデバイスとしては、個人の思考にアクセスすることができないことが理想的であるとしています。その点、AlterEgoはユーザが意識的にデバイスに送信しようとするものだけを読み取るものであり、ユーザが自分の考えを非公開にすることを可能にしているとしています。

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です