ガジェット通信 GetNews

見たことのないものを見に行こう
  • コムアイ(水曜日のカンパネラ)インタビュー「お風呂に入った猫がシュッと細くなってしまうところが情けなくて愛しい」
  • 『レディ・プレイヤー1』キャストインタビューで判明!「実際にこの映画をテーマにしたゲームが発売予定だよ」
  • 『ファンタビ』大切にしたのはティナがあの場面で「嫉妬心を出さないこと」キャサリン・ウォーターストン インタビュー
  • 『スター・ウォーズ/最後のジェダイ』でカイロ・レンはどうなっちゃうの? アダム・ドライヴァーを直撃!
  • 『ブレードランナー 2049』“ジョイ”と“ラヴ”にインタビュー「SF映画は女子が観ちゃだめ? そんなわけないわ!」
  • 戸次重幸が「理解出来ないほどの悪い役」に挑む実話をベースにした物語『神と人との間』
  • 北野武からの出演オファーに「役者やってて良かった」 『アウトレイジ 最終章』池内博之インタビュー
  • キアヌ・リーヴスに“仕事の流儀”を聞いてきた! 『ジョン・ウィック:チャプター2』が本日公開
  • 『マイティ・ソー バトルロイヤル』女戦士・ヴァルキリーを熱演! 声優・沢城みゆき「ロキ様ファンの方お友達になってください!」
  • 柄本佑が前田敦子を絶賛「“僕のあっちゃん、私のあっちゃん”にしたくなる魅力がある」
  • 福士蒼汰&吉沢亮 2人の成長した部分とは?映画『BLEACH』撮り下ろしインタビュー
  • 俳優・中村倫也インタビュー「女子の周りから固める恋愛作成は逆効果な気がします(笑)」
  • 不潔で下劣な男に挑んだ阿部サダヲ「珍しく自分の写真を撮ったほど、別人になりきれた」
  • 『ジュマンジ』でタフな美女戦士を熱演! カレン・ギランの好きなゲームは「メガドライブ『ソニック・ザ・ヘッジホッグ3』」
  • 『斉木楠雄のΨ難』インタビュー 佐藤二朗「橋本環奈が高校にいたら可愛すぎて男子は正気を保てないでしょ」
  • B2takes!小澤廉×祭nine.寺坂頼我 グループ活動する2人が心がけていることは?映画『BD~明智探偵事務所~』撮り下ろしインタビュー
体験を伝える―『ガジェット通信』の考え方
ガジェ通制作ライブ
→ガジェ通制作生放送一覧

柴犬と焼いたマシュマロをどう見分けるのか Google レンズの機能と仕組みをプロダクトマネージャーが解説

「It’s a long journey(それは長い旅路である)」と書かれた1枚のスライド。その横には、柴犬が写った写真と、柴犬に見えるけど実は“焼いたマシュマロ”の写真が混ざって並べられています。こちらはGoogleがカメラを通してみた風景や写真から、何が写っているのかを教えてくれる「Google レンズ」を解説する際に用いられたスライドで、正確にモノを見分ける機能の開発は短期間でできるものではなく、「長い旅路」になると説明する資料。Googleは10月8日、Google レンズのメディアセミナーを開催し、グループプロダクトマネージャーのLou Wang氏からGoogle レンズの機能と仕組みが解説されました。

Google レンズは最新のコンピュータービジョン技術とAIを活用し、周囲にあるモノや見ているモノをそのまま検索できる機能。AndroidとiOSの「Google フォト」や「Google 検索」、「Google アシスタント」、Google スマートフォンのカメラアプリから利用でき、商品や動植物を調べたり、テキストのコピー&ペーストや翻訳ができます。

たとえばカメラをかざしてダリアを写すと、認識されたポイントを円で表示。検索ボタンをタップするとダリアの情報が表示されます。

英語のスピーチを考えると、辞書には18万語の言葉が収録されているのに対して、日常で話す会話で使うのは3000語程度。それに対して、身の回りにあるモノを見分けるには、何十億もの品物、動植物が存在する中から認識する能力が求められます。これを実現するのが機械学習。

Google レンズの機械学習には「Classification(分類)」「Detection(検出)」「Embeddings(分散表現)」「Model Training(モデル学習)」の4種類の技術が用いられているとのこと。

Classificationは、数百万の画像を利用した学習結果を用いて、画像内のモノにラベルをつけ、そのラベルの確からしさを算出する技術。誕生日ケーキのロウソクを吹き消す男の子が写った写真からは、「ケーキ」「誕生日」「冠」「風船」「誕生日ケーキ」といったラベルがつけられ、それぞれに確からしさが算出されていることが例示されました。Google レンズはプライバシーを重視し、個人の顔は検出していないとのこと。

Detectionは、オブジェクトが画像のどこにあるかを検出し、ユーザーに対して「ここに面白いものがあるよ」と注意を促したり、タップして検索する動作が可能になります。先ほどの誕生日の写真では、ケーキ、冠、風船がそれぞれどの位置にあるかを四角いマーカーで表示し、検出ができていることが示されました。

Embeddingsは重要な概念で、直感的にオブジェクトがどういう意味で特徴があるのかをベクトルで表現する方法。これにより、ある画像と他の画像がどれぐらい似ているかを算出できます。自動車が写った3枚の写真から、色違いで向きも異なる同じタイプの自動車が「似ているもの」と認識されていることが例示されます。

Model Trainingは、機械学習モデルの学習プロセス。従来、モデルの学習には大量のハードウェアと時間が必要だったのに対して、機械学習のためにGoogleが開発した集積回路の「Tensor Processing Unit」を用いることで処理が高速に。月単位で時間がかかっていた処理が数時間程度で終了するようになったとのこと。

ユーザーの身の回りにあるものを理解できるようにすることがGoogleの使命だと語るWang氏。ハイエンド端末だけでなく、ローエンド端末で動作するAndroid Goでも対応していることを挙げ、皆さんに使って欲しいとコメント。Android Go版はまずテキストの読み取り機能にフォーカスし、識字率の低い新興市場で、適切な教育が受けられない人たちが文章を理解するのに役立てたいとしています。

shnskの記事一覧をみる

記者:

宮原俊介(編集長) 酒と音楽とプロレスを愛する、未来検索ブラジルのコンテンツプロデューサー。ゲームコミュニティ『モゲラ』も担当してます

ウェブサイト: http://mogera.jp/

TwitterID: shnskm

  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。
スマホゲーム タラコたたき