Google LabsのNgram Viewerをいじってみたことはありますか? 何世紀にも渡って書かれてきた500万という本のデータベースの中から言葉やアイデアを探せるやみつきになるツールです。エレズ・リーバーマン・エイデンとジャン・バプティスト・ミシェルがその仕組みと、5000億語のデータが教えてくれるちょっと驚くようなことを見せてくれます。
エレズ・リーバーマン・エイデンとジャン・バプティスト・ミシェルは、グーグルなどと協力し本をデジタル化するプロジェクトを行っています。これによって現在、500万という本のデータベースが完成しており、その中には5000億語のデータが含まれています。
これらのデータから、単語を年代ごとに取り上げ、現在起こっている現象を使われている言葉から推測することができるといいます。
文化の最たる本や言葉から、過去から未来にかけてを理解しようとするこの試みは非常に興味深いものがありますね。情報化以前には出来なかった分析方法ですが、こういった研究が新しい事実を見つけ出すのに役立つのかもしれません。