国際学会参加報告WSDM2014


WSDM(Web Search and Data Mining)は、情報検索とデータマイニングに関する学会であり、 当該領域においてトップレベルの学会(採択率は16%前後)の一つとして知られています。
WSDM2014は2014年の2月24日〜28日(本会議は25日〜27日)にアメリカ合衆国、ニューヨークで開催されました。

学術俯瞰システムに用いられているデータマイニング技術(社会ネットワーク分析、自然言語処理)に関して 最先端の研究が発表されている点、当該分野においてトップクラスの業績を誇る研究者が多数参加している点から、 当センターおよび技術経営戦略学専攻 坂田・森研究室から3名が参加し、発表の聴講および参加者達との意見交換を行ってまいりました。

また、会議への参加に伴い、会場近くに拠点を置く楽天技術研究所を訪問し、 同様に最近の自然言語処理技術の動向調査を行うと共に、研究者たちとの意見交換を行いました。

今回の会議・研究所訪問において、特に印象に残った観点としては、下記のようなものが挙げられます。

1.既存技術の大規模・高速化
 

本会議では、下記のように既存の社会ネットワーク分析手法を大規模・高速化した論文など、既存の技術を大規模データに適用できるよう改良を図ったものや、高速化している研究が数多く見受けられました。
■ Fast Approximation of Betweenness Centrality Through Sampling
■ Effective Co-betweenness Centrality Computation

データの大規模化が進んでおり、既存の手法では処理困難な事例が増えているために、 このような傾向が生まれていると考えられます。当センター、研究室においても同様に大規模データを扱うことが多いため、最先端の手法をフォローアップし、必要があれば研究に組み込んでいくことでさらなる飛躍を遂げられることと思います。
また、実際、現在学術俯瞰システムの導入を検討しているWORD2VECという大規模データ向け自然言語処理技術は、 楽天技術研究所内でも活用されており、最先端技術のフォローアップが大きな成果につながっているという好例に触れることができました。楽天技術研究所NYは、New York大学所属の関根教授の協力により設立された研究所であり、 自然言語処理の分野におけるトップレベルの研究者達が在籍しています。


2.企業内データの積極的活動
 

本会議では、クローズドな企業内データを分析することで新たな知見を得ている例が散見されました。 例えば、下記の論文では、eコマースサイトの企業内データを分析するために新たな手法が提案されているものです。

■Search Engine Click Spam Detection Based on Bipartite Graph Propagation
■Latent Dirichlet Allocation based Diversified Retrieval for E-commerce Search

このように、今後は、より大規模でリッチなデータにアクセスできることが研究における一つの優位性になることが考えられます。
イノベーション政策研究センター、また坂田・森研究室としても、様々なリソースを活用して、多様なデータにアクセスできるように努めていきたいと思います。






(文/榊剛史・丸井淳己)



▲ページトップへ