ガジェット通信

見たことのないものを見に行こう

「モザイクで隠された読めない文字」を復元・解読する方法!?

DATE: BY:
  • ガジェット通信を≫


今回は平林純さんのブログ『雑学界の権威・平林純の考える科学』からご寄稿いただきました。

「モザイクで隠された読めない文字」を復元・解読する方法!?


(画像が見られない方は下記URLからご覧ください)
http://px1img.getnews.jp/img/archives/moz01.jpg

上の運転免許証の写真のように、一部の文字を読むことができないように(判別できないように)モザイク処理をして、(公開できない情報が一部含まれている)機密文章や個人情報が含まれた写真などを公開することがあります。今回はそんな「モザイクで隠された読めない文字」を復元し、解読する方法について考えてみることにします。

モザイク処理にも色々ありますが、今回対象にするのは「文字サイズより大きいモザイク」です。たとえば、実例を作ってみたのが、たとえば下のような画像です。こんな秘密メッセージ、モザイクが掛かっていて肝心な部分を読み取れない秘密文章の内容を、解き明かすことができるでしょうか?


(画像が見られない方は下記URLからご覧ください)
http://px1img.getnews.jp/img/archives/moz02.jpg

まず、一見して、このモザイク部分には全部で5文字が隠されているということが明らかです。そして、その前に書かれた「一番最初は」という部分を見ると、ヒラギノゴシックの(画面解像度上で)18ポイントの大きさで書かれている、ということもわかります。つまり、モザイク部分に隠れているのは、多分「18ポイントのヒラギノゴシックで5文字」だということがわかります。

さて、次は「モザイク部分の濃さ」に着目してみましょう。五文字の濃さは「濃・濃・薄・濃・薄」となっています。すると、「漢字は濃く見える・ひらがなは薄く見える」ということから、「漢字2文字+ひらがな1文字+漢字1文字+ひらがな1文字」ではないかという予想ができます。…しかし、これだけでは全く何のことかわかりません。

そこで、モザイク部の濃さをもっと詳しく調べてみると、モザイク部は20×20ピクセルで、画素値は(それぞれ)195, 196, 217, 205, 230となっています。ここで、コンピュータで解析を行うコード(プログラム)を書き・実行してみると(参考データ *1)、18ポイントのヒラギノゴシックを20×20ピクセルのモザイク処理をしたとき、画素値が195, 196, 217, 205, 230になる可能性のある文字は、次のようになります。ちなみに、文字の並びは「(Google調べによる *2)使われる頻度が高い順番」に沿っています。つまり、前に並んでいるものほど「(前後の言葉との関係などを無視すれば)使われてる可能性が高い(かもしれない)」というものです。

*1:「Jun Hirabayashi@hirax」『twitter』
https://twitter.com/hirax/status/313212499258392576

*2:「新常用漢字表のための漢字出現頻度調査」
https://sites.google.com/site/shibano/shin-jouyoukanji-hyou-no-tame-no-kanji-shutsugen-hindo-chousa

・ 画素値195になる可能性のある文字

“店”, “目”, “法”, “所”, “決”, “材”, “求”, “町”, “及”, “治”, “昨”, “辺”, “況”, “完”, “走”, “充”, “攻”, “血”, “豆”, “河”, “渋”, “巨”, “封”, “祈”, “尚”, “荘”, “皿”, “忠”, “仰”, “劣”, “灰”, “炉”, “洪”, “朱”, “忌”, “且”, “抄”, “弔”, “拉”

・ 画素値196になる可能性のある文字

“学”, “当”, “全”, “切”, “状”, “告”, “足”, “歩”, “休”, “伝”, “宅”, “谷”, “史”, “児”, “百”, “列”, “包”, “旧”, “耳”, “旬”, “乱”, “祉”, “杉”, “卓”, “往”, “芳”, “克”, “兆”, “矛”, “瓦”, “冶”

・ 画素値217になる可能性のある文字

“小”, “士”, “に”, “ル”, “よ”, “ど”, “ジ”, “サ”, “オ”, “ゴ”

・ 画素値205になる可能性のある文字

“行”, “今”, “文”, “化”, “予”, “公”, “主”, “北”, “守”, “又”, “礼”, “忙”, “仏”, “巧”, “孔”, “な”, “る”, “ま”, “を”, “が”, “ボ”

・ 画素値230になる可能性のある文字

“く”, “へ”, “ェ”, “ヘ”, “ヶ”, “ゥ”

こうすると、かなり候補が絞られます。まず、カタカナは使われてなさそうですから、最後の2文字は「行く」の可能性が高いでしょう。すると、その前の文字はたぶん「に」で、合わせて「に行く」になりそうです。あとは、最初の2文字を手当たり次第組み合わせてみると、そして意味が通じる組み合わせを探していくと…「渋谷」という有力候補が浮かび上がってきます。(進路に関する話であれば「法学に行く」という候補も有力そうですが)

そう、この暗号の答えは「一番最初は渋谷に行く」でした。モザイク処理が掛かって全く読むことができなさそうであっても、文脈や文字(フォント)の情報を組み合わせていくと、「可能性が高そうな組み合わせ・内容」が浮かび上がってきたりするのです。


(画像が見られない方は下記URLからご覧ください)
http://px1img.getnews.jp/img/archives/moz03.jpg

執筆: この記事は平林純さんのブログ『雑学界の権威・平林純の考える科学』からご寄稿いただきました。

寄稿いただいた記事は2013年03月25日時点のものです。

カテゴリー : 生活・趣味 タグ :
寄稿の記事一覧をみる ▶

記者:

ガジェット通信はデジタルガジェット情報・ライフスタイル提案等を提供するウェブ媒体です。シリアスさを排除し、ジョークを交えながら肩の力を抜いて楽しんでいただけるやわらかニュースサイトを目指しています。 こちらのアカウントから記事の寄稿依頼をさせていただいております。

TwitterID: getnews_kiko

  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。

TOP