多様な観点から企業内外のデータを分析して
顧客・ユーザの本質的な行動原理に近づく

Mitsuo Yoshida
吉田 光男 准教授

 データから知識を抽出するデータマイニングの分野で軽視されがちな、データそのものの特性分析に携わり、サイバー空間(仮想空間:ウェブ)とフィジカル空間(現実空間:実社会)との関係性を明らかにする問題に取り組んでいます。この研究領域は、計算機科学と社会科学との狭間に位置し、近年では計算社会科学(Computational Social Science)と呼ばれるようになりました。

 私が取り組んでいる研究課題の代表的なものとして、ソーシャルメディアでの言及をもとにした、新たな研究評価指標の開発とその応用があります。従来の研究評価指標は、専門家(研究者)の視点のみで評価されており、また、いわゆる理系に有利で文系には不利な指標となっていました。さらに,研究情報へのアクセスという点から、オープンアクセス(研究情報への無償のアクセス)は十分に普及しつつある一方、研究情報の探索支援は国内のみならず海外でも道半ばです。このような問題に対処するために、人々による研究情報(論文)の共有や研究成果の広がりといった社会現象をモデル化し、専門家以外でも使いやすい論文検索システムの確立を目指しており、ソーシャルメディアで言及される論文の特徴分析、論文の普遍性を判定するアルゴリズムの開発などに取り組んでいます。

 サイバー空間で発生している社会現象の分析として、情報拡散行動に関するデータ(Twitterのリツイート)を大規模に収集し、エコーチェンバー現象の要因(接触情報の偏り)や党派性による情報拡散強度の違いなどを明らかにしたり、昨今のCOVID-19に関するユーザの感情変化の推移を分析したりしています。ソーシャルメディアのデータをフィジカル空間と対応付ける際に必要となる居住地の推定や都市機能との関係分析、外国人観光客の好むスポットの特定などにも取り組みました。

 研究と開発は両輪であると考えています。ウェブサービスの開発・運営もしており、現存する日本語のロボット型ニュース検索エンジンとしては最古となる Ceek.jp News や、日本語論文の社会的インパクトを測定する Ceek.jp Altmetrics などの運用を続けています。

 私が専門とする計算社会科学は、人間の相互関係によって成り立つ社会をデータに基づいて解明していく学問で、ビッグデータやコンピュータの活用が可能にするデジタル時代の社会科学です。常に記録され続ける大規模ソーシャルデータの登場と、それを扱うための情報技術や数理的枠組みの発展により生み出されました。扱う手法は多岐にわたり、私もネットワーク分析、テキスト分析(自然言語処理)、統計モデリング(回帰分析)、機械学習などを駆使し、企業が保有するデータを含む様々なデータを分析しています。

 多様な観点から企業内外のデータを分析することは、顧客・ユーザの本質的な行動原理を理解し、よりニーズに沿ったアプローチに繋がります。また、物事の本質にせまる研究に取り組むことは、企業における事業貢献という点では、競合優位性の確立や売上への貢献だけでなく、社会問題から身を守る盾になるとも言えます。データの利活用に関わる企業は、その法規制やプライバシー、情報統制を無視することはできません。社会的な問題は、研究をしていく中でその芽に気づくことが多くあります。フィルターバブルやエコーチェンバーについても、少しずつメディアに取り上げられているものの、まだ本格的な問題になってはいません。しかし、今後大きな社会問題になるだろうと予測しています。企業はそれに対して何をしているのかと問われた時,研究は一つの楔(くさび)になるでしょう。また、事業現場で問題となっている事柄、あるいは暗黙知となっている事柄の多くには、類似する研究成果があります。大学院生と会社員という二足のわらじを履くことは簡単ではないものの、大学院生として得た研究に関する知識、ここでは主に先行研究に関する知識を指しますが、これは、自身の問題解決能力を高めるほか、その知識を会社でも共有することで、周囲の問題解決能力を高めることにも繋がることでしょう。

 データサイエンスの主流は「データ分析」であるものの、データの統計処理そのものは「分析」でないことに留意する必要があります。分析の前に、データそのものの妥当性の検証が必要で、そのためにはドメイン知識が必要となります。例えば、COVID-19に関する症例データ集合や患者数のデータを渡されたとしても、そのデータ集合の切り出しが適切でなければ、どのような統計処理をしたとしても妥当な分析結果は得られません。その点、GSSMの受験を検討している皆さんは、ビジネス現場で得たドメイン知識を持っていますし、分析結果をどのように利活用したいかも明確でしょう。あとは、GSSMで多様な分析手法とその留意点を学ぶだけです!皆さんが現場で蓄えた知識や経験をもとに、新たな着眼点で実在データを分析し、新たな扉を開きましょう!!

上に戻る