体験を伝える―『ガジェット通信』の考え方

面白いものを探しにいこう 本物を体験し体感しよう 会いたい人に会いに行こう 見たことのないものを見に行こう そしてそれをやわらかくみんなに伝えよう [→ガジェ通についてもっと詳しく] [→ガジェット通信フロアについて]

「モザイクで隠された読めない文字」を復元・解読する方法!?

「モザイクで隠された読めない文字」を復元・解読する方法!?


今回は平林純さんのブログ『雑学界の権威・平林純の考える科学』からご寄稿いただきました。

「モザイクで隠された読めない文字」を復元・解読する方法!?

「モザイクで隠された読めない文字」を復元・解読する方法!?


(画像が見られない方は下記URLからご覧ください)
http://px1img.getnews.jp/img/archives/moz01.jpg

上の運転免許証の写真のように、一部の文字を読むことができないように(判別できないように)モザイク処理をして、(公開できない情報が一部含まれている)機密文章や個人情報が含まれた写真などを公開することがあります。今回はそんな「モザイクで隠された読めない文字」を復元し、解読する方法について考えてみることにします。

モザイク処理にも色々ありますが、今回対象にするのは「文字サイズより大きいモザイク」です。たとえば、実例を作ってみたのが、たとえば下のような画像です。こんな秘密メッセージ、モザイクが掛かっていて肝心な部分を読み取れない秘密文章の内容を、解き明かすことができるでしょうか?

「モザイクで隠された読めない文字」を復元・解読する方法!?


(画像が見られない方は下記URLからご覧ください)
http://px1img.getnews.jp/img/archives/moz02.jpg

まず、一見して、このモザイク部分には全部で5文字が隠されているということが明らかです。そして、その前に書かれた「一番最初は」という部分を見ると、ヒラギノゴシックの(画面解像度上で)18ポイントの大きさで書かれている、ということもわかります。つまり、モザイク部分に隠れているのは、多分「18ポイントのヒラギノゴシックで5文字」だということがわかります。

さて、次は「モザイク部分の濃さ」に着目してみましょう。五文字の濃さは「濃・濃・薄・濃・薄」となっています。すると、「漢字は濃く見える・ひらがなは薄く見える」ということから、「漢字2文字+ひらがな1文字+漢字1文字+ひらがな1文字」ではないかという予想ができます。…しかし、これだけでは全く何のことかわかりません。

そこで、モザイク部の濃さをもっと詳しく調べてみると、モザイク部は20×20ピクセルで、画素値は(それぞれ)195, 196, 217, 205, 230となっています。ここで、コンピュータで解析を行うコード(プログラム)を書き・実行してみると(参考データ *1)、18ポイントのヒラギノゴシックを20×20ピクセルのモザイク処理をしたとき、画素値が195, 196, 217, 205, 230になる可能性のある文字は、次のようになります。ちなみに、文字の並びは「(Google調べによる *2)使われる頻度が高い順番」に沿っています。つまり、前に並んでいるものほど「(前後の言葉との関係などを無視すれば)使われてる可能性が高い(かもしれない)」というものです。

*1:「Jun Hirabayashi@hirax」『twitter』
https://twitter.com/hirax/status/313212499258392576

*2:「新常用漢字表のための漢字出現頻度調査」
https://sites.google.com/site/shibano/shin-jouyoukanji-hyou-no-tame-no-kanji-shutsugen-hindo-chousa

1 2次のページ
寄稿の記事一覧をみる

記者:

ガジェット通信はデジタルガジェット情報・ライフスタイル提案等を提供するウェブ媒体です。シリアスさを排除し、ジョークを交えながら肩の力を抜いて楽しんでいただけるやわらかニュースサイトを目指しています。 こちらのアカウントから記事の寄稿依頼をさせていただいております。

TwitterID: getnews_kiko

  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。