ガジェット通信

見たことのないものを見に行こう

本日アプリ版リリース!白石俊平氏、ITエンジニア向けキュレーションサービス「TechFeed」の野望を語る──

DATE:
  • ガジェット通信を≫

毎日3000のRSSリンクを見ていたからこそ

「IT系のエンジニアが本当に必要とする情報は、なかなか一般的なメディアには登場しない。英語の情報であればたくさんあるけれど、翻訳されるのはごく一部。必要な情報を世界中から集めて、素早く見られるようにしたい。
内外の数多くの専門メディア、個人ブログやGitHubなどから情報を収集し、それをわかりやすく紹介するキュレーションサービスです」と「TechFeed」を紹介するのは、オープンウェブ・テクノロジーCEOの白石俊平氏だ。Web技術者向け情報メディア「HTML5 Experts.jp」編集長も務めている。

株式会社オープンウェブ・テクノロジー CEO 白石俊平氏

html5jのメーリングリストの開始当初、2年間に渡りキュレーションした情報を毎日ポストとするという作業をやっていました。毎日、RSSリーダーを3000見出しぐらい見て、情報をセレクトする作業。それだけ頑張っても、アクセスできる情報はごく一部。専門のWeb技術だけで精一杯で、IT業界全体の情報まではカバーできなかった。そもそも人力でやるのには限界があったんです」

情報感度の高い人は、個人的に白石氏と似たような作業を日々こなしているかもしれない。しかし、インターネットの広大な海を、小さな船窓から覗いているという意味では同じだ。

ましてや情報感度がそこまで高くない人は、自分が必要とする情報をどこから得れば良いかすらわからないことも多い。。

「コミュニティ活動や依頼された講演などでよく地方に行くんですが、中央と地方とでは情報感度に差があることに気付きました。シリコンバレーと日本でももしかしたら格差があるかもしれない。僕が、html5jのコミュニティを作ったのも、もともとは日本のWeb技術を世界最先端にまで高めたかったから。それを情報の格差が邪魔しているのだとすれば、それをカバーするメディアが必要だと痛感していたんです」と、TechFeedを作った狙いを語る。

情報のキュレーション作業を独自アルゴリズムで自動化

とはいえ、膨大な情報から有益な情報だけを適切に選んでいくためには、人力では限界がある。そこでTechFeedは、情報のキュレーション作業を独自アルゴリズムで自動化させた。

RSSなどの情報を数万レベルで自動的に収集し、それを分類し、記事ごとにAからDまでの評価付けを行い、配信する。これら一連の作業を自動化するアルゴリズムを自ら書いた。

技術的なポイントはクローリング、クラスタリング、スコアリング、フィルタリング、デリバリー(ユーザーに情報をどう届けるか)ということになる。

「フィルタリングは機械学習など人工知能を使ってやることもできるし、いずれは僕らもそうしたいと考えていますが、最初は自分たちが作り込んだアルゴリズムのほうがメンテナンスしやすかった。そのままではスケールしづらいという問題はあるものの、とりあえず精度を高めるために、結果を予想しやすい自作のアルゴリズムを書きました」

データ収集は、RSSのリンクからHTML記述を引っ張ってきて、それをコンピュータに読ませるというやり方。まずは不要なヘッダー、フッダーを省き本文を抽出し、単語を区切る。

それらの単語と辞書とを付き合わせて、単語の頻出度などから、それがどの分野の記事なのかを分類する。

「最初はTwitterのキーワード検索をベースにしようと試してみたんですが、スパムやbotのつぶやきなどノイズが多すぎて、ほとんど使いものになりませんでしたね。現在は信頼できるリソースをいくつか組み合わせてデータを集めています」

評価の自動化については、ソーシャルの評判をベースに、様々な要素を加味して結果を得る。

英語圏は人口が多いので、単純にやると英語圏情報ばかりになる。そのあたりは人口比を勘案してソーシャルスコアをチューニング。

最初はどの記事も収集時点では最低のDランクからスタートするが、人気度を頻繁にサーチしているので、普遍性の高い良記事であればあるほど、ランクアップする。

「有益度と人気度はイコールではないが、全く相関関係がないともいえない。何が大事かは人によって違うので、今後はパーソナライズにも注力していきたい」と白石氏。

また英語圏の情報についても、将来的には何らかのAPIを使って、自動翻訳サービスを提供したいとも考えている。「言語の壁を突破して、世界の技術情報を紹介する」ことが目標だからだ。

白石氏はこうした自然言語のフィルタリング処理のアルゴリズムを書くのは初めて。同社CTOの高岡大介氏との共同作業だったが、「僕らは大学などの研究者とは違うから、見よう見まねのところがある。チューニングを重ねて、日々精度を上げていきたい」と語る。

モバイルアプリ開発、プロモーションイベントも予定

TechFeedのビジネスモデルは、今のところ一般的なWebメディアと同じく、広告ということになる。有料会員になればその広告を外せるという方法もあるだろう。

「これについては、先行事例が無数にあるので、これからいろいろ考えていきたい」と白石氏は言うが、実際、このあたりの事業化については「あまり得意ではない」とも告白する。

「僕はこれまでの人生で、ライターとかエンジニアとかコミュニティリーダーといった肩書きで仕事をしてきたけれど、お金儲けというのはほとんど考えたことがないんです。誰か僕にビジネスを教えてくれる人がいないでしょうかね(笑)」

オープンウェブ・テクノロジー社ももともとは白石氏の個人事務所だったのを、2015年からは国立研究所でセマンティックWebなどの研究をしていた高岡大介氏をCTOに、html5jコミュニティの現代表・吉川徹氏をCXOに迎えて、会社としての陣容を整備してきた。

つまりWeb系スタートアップとしてリスタートを切ったばかりの会社なのだ。

エンジニア・コミュニティ作りが人生の生き甲斐とまで話していたことがある白石氏も、久しぶりに自分でコードを書いた。

「経営からプログラミングまで全部やらないといけない。株式をもってもらうときに株数をどうするかという資本政策からコーディングまで、同じ生活時間のなかで考えなければならないのは正直しんどいです。しかし、これまでの自分の経験が全部活かせる場だと思って、ここは踏ん張りたい」

TechFeedは2015年12月1日にWebプレビュー版をリリース。現在、2300人の会員登録がある。

「全くプロモーションをしていなかったわりには、幸先の良いスタート」(白石氏)。

しかし、メディアとして成功するためには少なくとも万の単位の登録ユーザーを抱える必要はあるだろう。

開発中だったモバイルアプリ版も、7月26日に正式リリースした。

「会社としては、TechFeedでIT業界を盛り上げつつ、メディアテクノロジーを究めたい。さらに機械学習などのAI技術を習得することで、これからのトレンドにコミットできるだけの自力を蓄えたいと考えています。TechFeedが成功したら、もしかするとこの仕組みを使ってTech系じゃないところのキュレーションサービスに横展開するかもしれない、なんてこともちらっと考えたりしています」と、白石氏はこれからの野望を語る。

「3人しかいないスタートアップ。これまではTechFeedというプラットフォームをつくるのに専念していて、プロモーションなど考えていなかったのですが、そろそろ動き出したい」と、8月10日に初めてのプロモーションイベント「TechFeedLive」を開催する予定だ。

8月10開催!TechFeed Live#1 「そろそろ本気で始める機械学習

日々の情報収集を手軽に、そして最先端技術を吸収したいと考える全てのエンジニアにとって、TechFeedにアクセスするのが毎日の日課になる──それはそう遠い未来ではなさそうだ。

(執筆:広重隆樹 撮影:刑部友康)

カテゴリー : デジタル・IT タグ :
CodeIQ MAGAZINEの記事一覧をみる ▶
  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。

TOP