English version: researchmap

研究内容

データから知識を抽出するデータマイニングの分野で軽視されがちな,データそのものの特性分析に携わり,サイバー空間(仮想空間:ウェブ)とフィジカル空間(現実空間:実社会)との関係性を明らかにする問題に取り組んでいます。この研究領域は,計算機科学と社会科学との狭間に位置し,近年では計算社会科学(Computational Social Science)と呼ばれるようになりました。

具体的に取り組んでいる研究課題には様々なものがありますが,代表的なものとして,ソーシャルメディアでの言及をもとにした,新たな学術文献評価指標の開発とその応用があります。この取り組みでは,人々による研究情報(論文)の共有や研究成果の広がりといった社会現象をモデル化し,専門家以外でも使いやすい論文検索システムの確立を目指しており,ソーシャルメディアで言及される論文の特徴分析,論文の普遍性を判定するアルゴリズムの開発などに取り組んでいます。また,サイバー空間で発生している社会現象の分析として,情報拡散行動に関するデータ(リツイート)を大規模に収集し,エコーチェンバー現象の要因(接触情報の偏り)や党派性による情報拡散強度の違いなどを明らかにしたり,昨今のCOVID-19に関するユーザの感情変化の推移を分析したりしています。ソーシャルメディアのデータをフィジカル空間と対応付ける際に必要となる居住地の推定や都市機能との関係分析,外国人観光客の好むスポットの特定などにも取り組みました。

以前はニュースやブログをはじめとするウェブページのコンテンツを自動抽出する研究を行っていました。ウェブページのコンテンツを抽出する事により,ウェブ検索エンジンの性能向上,ウェブページの研究利用促進などが期待されます。民間企業との共同研究を通じ,成果の一部は製品(ウェブサービス)に導入されています。

研究と開発は両輪であると考えています。ウェブサービスの開発もしており、現存する日本語のロボット型ニュース検索エンジンとしては最古となる Ceek.jp News や、日本語の学術文献の社会的インパクトを測定する Ceek.jp Altmetrics などの運用を続けています。

共同研究を積極的に進めています。内容は多岐にわたりますが,特にデータ収集やデータクレンジングで貢献できると思います。お気軽にご連絡下さい。Twitterのサンプルストリーム(全言語:2011年10月~2023年6月,途中欠損あり),位置情報付きツイート(日本国内:2011年5月20日~2023年3月14日,全世界:2014年7月25日~2023年3月14日,ほぼ全てをカバー),公式リツイート(日本語・英語:2013年7月2日~2023年12月28日,その他の言語:2017年6月23日~2023年12月28日),リンク付ツイート(2018年7月23日~2023年12月28日),引用リツイート(日本語:2020年10月22日~2023年11月11日,その他の言語:2020年12月8日~2023年11月11日),ソーシャルグラフ月次観測(2014年1月~,計400万ユーザ程度を定点観測),Blueskyのストリーム(2023年7月9日~,全量),日本語Webニュースデータ(2004年4月~)などのデータを保持しています。

民間企業との共同研究も積極的に実施しており,特に新規事業のための研究開発に携わるケースが多いです(自身も起業経験があり,会社代表を兼業しています)。共同研究の進め方や支援内容については「Gunosyが挑む産学連携~企業としてなぜ研究開発に注力するのか?」にまとまっています。

学生募集

計算社会科学,ウェブ情報学,ソーシャルメディア分析,Science of Scienceなどの研究に興味のある学生を募集しています。学群・学部の学生および研究生は受入れておらず,大学院生(主に社会人)のみを受入れています。研究に対する考え方やテーマについては,インタビュー記事Webオープンキャンパスの資料もご覧下さい。なお,所属組織の特性上,学生が常駐できる部屋(研究室)がないため,日常的な研究活動のスペースをご自身で用意していただく必要があります(自宅や図書館・自習室など)。2024年10月現在,博士学生が6名(経営1名・リスク5名,早期修了プログラム1名),修士学生が9名(うち3名は休学中),配属されています。

修士:博士前期課程(経営学GP)

筑波大学 ビジネス科学研究群 経営学学位プログラム(博士前期課程)に入学する必要があります。経営学学位プログラムでは,入学試験の公平性の観点から,博士前期課程については受験前の研究相談を受付けていません。

経営学学位プログラムの博士前期課程は,入学時までに概ね1年以上の有職経験が必要な社会人大学院(夜間・東京キャンパス)です。一般的なビジネススクール(MBAコース)とは少し異なり,通常の大学院同様に,研究活動を重視しています。入学後の6月上旬より配属希望研究室訪問があり,その際の面談等を通じて配属研究室が決まります。授与される学位は「修士(経営学)」です。例年,入学試験は11月に行われます。

博士:博士後期課程(経営学GP,R2学位P)

筑波大学 ビジネス科学研究群 経営学学位プログラム(博士後期課程)または筑波大学 システム情報工学研究群 リスク・レジリエンス工学学位プログラム(博士後期課程)に入学する必要があります。博士後期課程については受験前の研究相談が可能です。博士後期課程は指導教員とのマッチング(研究テーマや指導方針)が重要であるため,事前面談を強くお勧めします。また,すでに研究業績をお持ちの方は,最短1年で修了できる「早期修了プログラム」の利用もご検討下さい。なお,修士号をお持ちでない方も,事前の資格審査で受験が認められることもあります。お気軽にご相談ください。

経営学学位プログラム(経営学GP)

経営学学位プログラムの博士後期課程は,入学時までに概ね2年以上の有職経験が必要な社会人大学院(夜間・東京キャンパス)です。授与される学位は「博士(経営学)」です。なお,出願時にTOEICの(デジタル)公式認定証(スコア)が必要になります。受験を検討中の方は,TOEICの受験もご検討ください(試験実施日の2年前以降の公開テストの(デジタル)公式認定証が必要です)。例年,入学試験は9月と1月に行われます(1月の入学試験の実施は9月の合格者数によって判断されますが,1月の入学試験に間に合うTOEIC公開テストの申込期限は概ね10月末です)。

2024年10月26日(土)に経営学学位プログラムのオープンキャンパス・大学院説明会があります。詳細は「2024年度経営学学位プログラム(博士後期課程)のオープンキャンパス開催のおしらせ」をご覧下さい。

2月実施入試の出願期間は2024年12月17日(火)10時~2025年1月6日(月)17時です。詳細は「【募集要項公開】法学学位プログラム(博士前期及び博士後期)経営学学位プログラム(博士後期)令和7年度大学院入試募集要項の公開について」「募集要項:経営学学位プログラム(博士後期課程)」をご覧下さい。出願にあたり,TOEICの(デジタル)公式認定証(スコア)の提出が必要です。

リスク・レジリエンス工学学位プログラム(R2学位P)

リスク・レジリエンス工学学位プログラムの博士後期課程は,社会人学生も積極的に受入れている,主に筑波キャンパスでの活動を中心とする大学院です。社会人の方が在職のまま東京キャンパスにおいて教育を受けることができる「昼夜開講プログラム」があります。また,標準修業年限(3年)での修了が困難な方は,修業年限を3年から5年に延長できる「長期履修制度」の利用もご検討下さい(3年分の学費で5年在籍できます)。授与される学位は「博士(工学)」です。なお,出願にあたっては志望指導教員の内諾が必要になります。学位プログラムの規則上,副指導としての受入れになりますが,実質的な主指導として研究指導を行います。一般入学試験・社会人特別選抜の別を問わずに受入可能です。例年,入学試験は8月と1月に行われます。

1月実施入試の出願期間は2024年12月2日(月)12時~12月12日(木)15時です。詳細は「システム情報工学研究群 博士後期/一貫制博士課程(3年次編入学) 募集要項」のリスク・レジリエンス工学の要項をご覧下さい。出願にあたり,指導希望教員からの内諾が必要です。

社会人大学院で学ぶ意義や学術研究ってなに?

以下の記事や図書がお勧めです。(後でちゃんと書く)

授業資料の一部。(クリックで拡大)

在学生向け:配属希望面談(2024年度) ※参考

指導可能なテーマや考え方については,以下のページもご参照下さい。

研究指導の方針やスケジュールについては,以下のように考えています。

2021年7月に赴任してからの修士修了生は5名おり,全員が1回以上の学会発表を行い,2名が博士後期課程に進学しました。

共有計算機(Debian, Ubuntu)として,以下のものがあります。

論文・講演など

図書

  1. 数理社会学事典
    • 数理社会学会 数理社会学事典刊行委員会(編集)
    • 担当:15-4 ビッグデータ収集
    • 丸善出版
    • 2022年8月
  2. 実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門
    • 榊剛史(編著), 石野亜耶, 小早川健, 坂地泰紀, 嶋田和孝, 吉田光男
    • 担当:第5章 データ収集, 第8章 ソーシャルメディアテキストの解析
    • 講談社
    • 2022年3月
    • サポートページ
  3. Japanese Public Sentiment on South Korea: Popular Opinion and International Relations (Politics in Asia)
  4. 計算社会科学入門
    • 鳥海不二夫(編著), 石井晃, 岡田勇, 上東貴志, 小林哲郎, 榊剛史, 笹原和俊, 高野雅典, 瀧川裕貴, 常松淳, 三浦麻子, 水野貴之, 山本仁志, 吉田光男
    • 担当:第4章 データ収集・公開データセット
    • 丸善出版
    • 2021年1月
    • サポートページ

学術論文(査読有り)

  1. Breaking the Spiral of Silence: News and Social Media Dynamics on Sexual Abuse Scandal in the Japanese Entertainment Industry
  2. A multilingual analysis of pro Russian misinformation on Twitter during the Russian invasion of Ukraine
  3. Anti-vaccine rabbit hole leads to political representation: the case of Twitter in Japan
  4. The variant of efforts avoiding strain: Successful correction of a scientific discourse related to COVID-19
  5. Twitter上における学術論文拡散の分析 ―COVID-19関連論文を例にして― (事例/調査報告)
  6. A cross-lingual analysis on the spread of misinformation using the case of Ivermectin as a treatment for Covid-19
  7. Twitter mobility dynamics during the COVID-19 pandemic: a case study of London
    • Chen Zhong, Robin Morphet, Mitsuo Yoshida
    • PLOS ONE. vol.18, no.4, e0284902, 2023.
    • April 26, 2023
  8. データ分類タスクにおけるCompression-based Dissimilarity Measureの精度と速度の改良
  9. 特徴選択を導入した低・ゼロ頻度N-gramの効率的なゆう度比推定法
  10. Do media events still unite the host nation's citizens? The case of the Tokyo 2020 Olympic Games
  11. 反転授業の事前学習動画において教師から学習者に対してアノテーションを付与する機能の開発と検証
  12. 論文のオルトメトリクスに関するバースト特性分析
  13. Impact of correcting misinformation on social disruption
  14. 日本におけるオンライン・ハラスメントの現状と対策:Twitterでの女性記者のツイート「炎上」を例に
  15. Japanese conservative messages propagate to moderate users better than their liberal counterparts on Twitter
  16. Unified Likelihood Ratio Estimation for High- to Zero-frequency N-grams
  17. Cross-Country Analysis of User Profiles for Graph-based Location Estimation
  18. インターネット上のユーザの行動データを用いた論文の普遍性の分析手法
  19. ソーシャルメディアを用いた新型コロナ禍における感情変化の分析
  20. ソーシャルグラフによる居住地推定のためのユーザプロフィール分析
  21. VR system for spatio-temporal visualization of tweet data and support of map exploration
  22. Twitterからの言及数が多い論文は言及されたことのない論文と比べてタイトルが「面白い」
    • 佐藤翔, 石橋柚香, 南谷涼香, 奥田麻友, 保志育世, 吉田光男
    • 情報知識学会誌. vol.29, no.3, pp.268-283, 2019.
    • 2019年10月15日
  23. 観測頻度に基づくゆう度比の保守的な直接推定
  24. Profiling the Spatial Structure of London: From Individual Tweets to Aggregated Functional Zones
  25. Extraction of Tourist Destinations and Comparative Analysis of Preferences Between Foreign Tourists and Domestic Tourists on the Basis of Geotagged Social Media Data
  26. 講師のシルエットを透過表示した板書映像の生成とライブビューシステム
  27. ジオタグ付きツイートを用いた交通路の抽出法
  28. 条件付き確率の保守的な推定
  29. 日本の学協会誌掲載論文のオルトメトリクス付与状況
  30. 日本における居住地推定に利用するためのフォロー関係の調査
  31. トレンドキーワードに関するウェブリソースの横断的分析
  32. ツイート投稿位置推定のための単語フィルタリング手法
  33. ラベル伝搬によるトレンドクエリのカテゴリ推定
  34. ブログページ集合からのポストおよびコメント自動分離抽出手法
  35. 教師情報を必要としないニュースページ群からのコンテンツ自動抽出

解説論文等(招待論文)

  1. ソーシャルメディアデータを用いた都市空間分析
  2. COVID-19渦中でメディア発信した専門家への攻撃
  3. 深層学習による自然言語処理の急進化と事業サービス応用における課題
  4. 計算社会科学におけるデータの収集と活用
    • 吉田光男
    • 経済セミナー. vol.32, no.729, pp.22-28, 2022.
    • 2022年11月
  5. COVID-19をめぐるメディア・コミュニケーションとその課題
  6. ソーシャルメディア上の情報拡散とその理解
  7. ソーシャルデータ分析のためのデータ収集
    • 吉田光男
    • Estrela. no.330, pp.2-7, 2021.
    • 2021年9月10日
  8. OS-1計算社会科学
  9. COVID-19流行下でのインフォデミック ―Twitterで流れたGoToトラベルに関する情報―
  10. COVID-19流行下におけるソーシャルメディア ―日本での状況と研究動向・公開データセット―
  11. 集合知による新たな研究評価
  12. レファレンス協同データベースの登録事例から垣間見る日本のレファレンスサービス
  13. ソーシャル言及数で論文に新たな評価軸
  14. オルトメトリクスは論文評価を変えるか -ソーシャルメディアで算出する新たな指標-
  15. 計量書誌学の新たな挑戦 -国産オルトメトリクス計測サービスの開発-
  16. ソーシャルメディアの政治的活用 ―活用事例と分析事例から―

国際会議・ワークショップ(査読有り・予稿集有り)

  1. Between Information Diffusion Trends and Emotions for TV Anime Works on Twitter
  2. Hater Is Not the Only Source of Toxic Communication Online, But Also Fan
  3. Analysis of Psychographic Indicators via LIWC and Their Correlation with CTR for Instagram Ads
  4. Large-Scale Analysis of Rural-Urban Differences in Geographic Homophily
  5. Follower–Followee Ratio Category and User Vector for Analyzing Following Behavior
  6. Applying Existing Datasets as a Pseudo Corpus for Sentiment Representation on Social Media
  7. Analysis of Leading Communities Contributing to arXiv Information Distribution on Twitter
  8. Do you trust experts on Twitter?: Successful correction of COVID-19-related misinformation
  9. Comparison of Indicators of Location Homophily Using Twitter Follow Graph
  10. Feature Selective Likelihood Ratio Estimator for Low- and Zero-frequency N-grams
  11. Comparing Two Counting Methods for Estimating the Probabilities of Strings
  12. Visual Linking of Feature Values in Immersive Graph Visualization Environment
  13. Visualization of sub-network sets by iterative graph sampling from large scale networks
  14. Analysis of Short Dwell Time in Relation to User Interest in a News Application
  15. The metrics of keywords to understand the difference between Retweet and Like in each category
  16. Improving Association Rule Mining for Infrequent Items Using Direct Importance Estimation
  17. Improving Estimation of Conditional Probability for Determining Importance of a Bigram
  18. User's Centrality Analysis for Home Location Estimation
  19. Usefulness of Instructor Annotations on Flipped Learning Preparation Video System
  20. 3D Visualization of Network Including Nodes with Labels
  21. Tourist Behavior Analysis Using Instagram Hashtags
  22. Analysis of the Influence of Internet TV Station on Wikipedia Page Views
  23. Analysis of User Dwell Time on Non-News Pages
  24. Analysis of Bias in Gathering Information Between User Attributes in News Application
  25. Analysis of Information Polarization During Japan's 2017 Election
  26. Analysis of Political Party Twitter Accounts' Retweeters During Japan's 2017 Election
  27. Analysis of User Dwell Time by Category in News Application
  28. Journal Name Extraction from Japanese Scientific News Articles [DOI]
  29. Information Diffusion Power of Political Party Twitter Accounts During Japan's 2017 Election
  30. Non-overlapping Counting of String Using Suffix Array
  31. Direct Estimation of Likelihood Ratio for the Analysis of Context
  32. Response Collector: A Video Learning System for Flipped Classrooms
  33. VR System for Spatio-Temporal Visualization of Tweet Data
  34. Visualization of diffusion behavior pattern of influencers by genre on SNS
  35. Visualization of diffusion behavior patterns on Twitter
  36. Spatio-Temporal Visualization of Tweet Data Using VR
  37. Temporal Analysis of Online Social Graph by Home Location
  38. Spatio-Temporal Visualization of Tweet Data around Tokyo Disneyland Using VR
  39. Feature Selection for Composer Classification Method using Quantity of Information
  40. When Do Users Change Their Profile Information on Twitter?
  41. Home Location Estimation Using Weather Observation Data
  42. Computing Information Quantity as Similarity Measure for Music Classification Task
  43. Finding Association Rules by Direct Estimation of Likelihood Ratios
  44. Can We Estimate Others' Friendships with a Single Interaction Features on Twitter?
  45. Polysemy Detection in Distributed Representation of Word Sense
  46. Uncovering Information Flow Among Users by Time-Series Retweet Data: who is a friend of whom on Twitter?
  47. Preliminary Investigation for Japanese Comic Analysis using Wikipedia
  48. Analysis of Home Location Estimation with Iteration on Twitter Following Relationship
  49. Improving Compression Based Dissimilarity Measure for Music Score Analysis
  50. Realizing Half-Diminished Reality from Video Stream of Manipulating Objects
  51. Using Conservative Estimation for Conditional Probability instead of Ignoring Infrequent Case
  52. Decision Tree Analysis of Tourists' Preferences Regarding Tourist Attractions Using Geotag Data from Social Media (note)
  53. Confidence Interval of Probability Estimator of Laplace Smoothing
  54. Wikipedia Page View Reflects Web Search Trend
  55. Patterns in Interactive Tagging Networks
  56. Why Do You Follow Him? Multilinear Analysis on Twitter [DOI]
  57. Exploiting Twitter for Spiking Query Classification

国際会議・ワークショップ(査読有り・予稿集無し)

  1. Regional Pricing Strategies in the Global Gaming Industry: A Study Focused on Steam
  2. Classification of Characteristic Locations Extracted from Sentiment Analysis of Tweets
  3. Categorization of Regional Pricing Trends Among Publishers on Steam
  4. Behind the Screens of Fandom: Unraveling the Threads of Online Platform
  5. A cross-lingual analysis of pro-Russian misinformation on Twitter during the opening weeks of the Russian invasion of Ukraine
  6. Acceptance of Narrative from Authoritarian States: The Case of the 2019 Hong Kong Protests in the Japanese Twitterverse
  7. Analysis of psychographic indicators via LIWC and their impact on CTR for Instagram ads
  8. Dramatic Reversal of Public Opinion and More Dramatic Change of the Attitude of Experts: A Case Study of a Discourse on HPV in Japanese Twitter
  9. The Covid-19 wonder-drug: A cross-lingual analysis of Ivermectin misinformation on Twitter
  10. Is User's Centrality Related to Hardness of Location Estimation?
  11. Conditional probability as Importance of Bigram
  12. Diversity of Political Information Received by Political Detachment Users on Social Media
  13. Do Political Detachment Users Receive Various Political Information on Social Media?

国内会議・ワークショップ(査読有り)

  1. 学術情報検索における閲覧論文の文献種別による分析
  2. 物体を操作する映像におけるHalf-Diminished Realityの実現 (ショート発表)
  3. トレンドキーワードに関するウェブリソースの横断的分析
  4. Webニュースを用いた未来情報年表の自動構築 (ポスター発表)
  5. CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得

国内会議・ワークショップ(査読無し・受賞関係のみ抜粋)

  1. テレビアニメ作品に関するSNS上の情報拡散傾向と感情の関係
  2. グラフサイズの影響を受けにくい適応型RWCの提案
    • 藤兼由生, 風間一洋, 吉田光男, 土方嘉徳
    • ARG 第17回Webインテリジェンスとインタラクション研究会
    • 2021年12月17日(金)~28日(土) at オンライン
    • 学生奨励賞
  3. 特徴選択を導入した低・ゼロ頻度N-gram の効率的な尤度比推定法
    • 菊地真人, 吉田光男, 梅村恭司, 大囿忠親
    • 第20回情報科学技術フォーラム
    • 2021年8月25日(水)~27日(金) at オンライン
    • FIT論文賞
  4. Twitter上のarXivプレプリントに関する学術情報流通のキーパーソンの特性分析
    • 嶋田恭助, 風間一洋, 吉田光男, 大向一輝, 佐藤翔, 桂井麻里衣
    • ARG 第16回Webインテリジェンスとインタラクション研究会
    • 2020年11月27日(金)~28日(土) at オンライン
    • 萌芽研究賞
  5. ソーシャルグラフにおけるユーザの中心性と居住地推定の難しさとの関係
    • 廣中詩織, 吉田光男, 梅村恭司
    • ARG 第14回Webインテリジェンスとインタラクション研究会
    • 2019年6月28日(金)~29日(土) at 兵庫県立大学神戸商科キャンパス(兵庫県神戸市)
    • スタートアップ賞
  6. ツイッターにおける政党公式アカウントのフォロワー特性分析
    • 鳥海不二夫, 吉田光男
    • ARG 第12回Webインテリジェンスとインタラクション研究会
    • 2018年6月17日(日)~18日(月) at 大久野島休暇村(広島県竹原市)
    • 優秀研究賞
  7. 検索行動量を用いた状態空間モデルによる自動車販売台数の予測
  8. NGA2015におけるユーザの情報収集と回遊行動の分析
  9. 重力モデルとTF-IDFを用いたジオタグ付きTwitterデータからの観光地抽出と魅力の評価
  10. Twitter位置情報・テキスト情報を用いた人の移動モデル構築と観光地推薦手法の提案
  11. 対象サービスに特化した日本語Webスペルチェッカーの開発 (データチャレンジ)
  12. 教師情報を必要としないWebページ群のコンテンツ自動抽出ツールの提案

その他の発表は researchmap の Misc をご覧下さい

招待講演等

  1. 計算社会科学入門
  2. 大規模ソーシャルメディアデータの収集・分析
    • 吉田光男
    • 2022年度CIGS経済・社会との分野横断的研究会
    • 2022年12月15日(木) at 日本工業倶楽部会館(東京都千代田区)
  3. Web・ソーシャルメディアを対象とするデータ収集・分析
  4. 社会現象を理解するためのデータの収集・分析
  5. ウェブデータの収集と学術情報分析
  6. ウェブマイニングのためのデータ収集と学術情報分析
  7. 産学連携によるコンテンツマーケティング技術の研究開発
  8. NGA2015におけるユーザの情報収集と回遊行動の分析
  9. Twitter位置情報・テキスト情報を用いた人の移動モデル構築と観光地推薦手法の提案
  10. ウェブマイニングのためのデータ収集と保存
  11. 不揃いなデータ達の分析を行う前のTips ― ウェブデータの収集と保存 ―
  12. トレンドと検索頻度とWikipediaページビューの三角関係
  13. 楽しい楽しい研究開発
  14. オルトメトリクスとは何か
    • 吉田光男
    • 平成26年度茨城県図書館協会大学図書館部会研修会
    • 2014年11月27日(木) at 筑波大学(茨城県つくば市)
  15. ソーシャルメディア上での学術文献の流通
  16. 学際的な研究とスタートアップ企業との産学連携
  17. 情報技術者・研究者の生きる道
    • 吉田光男
    • お茶の水女子大学附属高等学校 総合的な学習の時間「図書館情報メディア研究」
    • 2014年2月19日(水) at お茶の水女子大学附属高等学校(東京都文京区)
  18. 文献管理Tipsセミナー ―Mendeleyを使って―
    • 吉田光男
    • 筑波大学附属図書館 図書館講習会
    • 2013年7月16日(火) at 筑波大学(茨城県つくば市)
  19. 研究者から見た Mendeley
  20. 自然言語処理における企業と大学と学生の関係
  21. 開発運営を続ける楽しさ ~ニュース検索サイト CEEK.JP NEWS の開発を通じて~
  22. Web検索エンジンと共に
  23. 技術系サービスができるまで“日本発の検索エンジン”
    • 第2回WAZA CTOセミナー
    • 2006年7月29日(土) at 東京国際フォーラム(東京都千代田区)

学位論文

  1. ウェブ検索エンジンのためのテキスト種別特定に関する研究
  2. ブログページ集合からのポスト及びコメント自動分離抽出手法の研究
  3. 教師情報を必要としないWebページ群のコンテンツ自動抽出

ソフトウェア・デモシステム

  1. ExtractUniqueBlock - コンテンツ抽出(本文抽出) Perl モジュール

その他

  1. 日本学術振興会特別研究員(DC1)申請書
    • 2011年

受賞・表彰

  1. 石倉直樹, 土屋雅稔, 吉田光男, 言語処理学会第30回年次大会, サイバーエージェント賞(スポンサー賞), 2024年3月.
  2. 藤兼由生, 風間一洋, 吉田光男, 土方嘉徳. 第17回Webインテリジェンスとインタラクション研究会, 学生奨励賞, 2021年12月.
  3. 菊地真人, 吉田光男, 梅村恭司, 大囿忠親. 第20回情報科学技術フォーラム , FIT論文賞, 2021年12月.
  4. Ryosuke Homma, Yoshifumi Seki, Mitsuo Yoshida, Kyoji Umemura. The 2020 IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology, Best in Practice Paper Award, December 2020.
  5. 嶋田恭助, 風間一洋, 吉田光男, 大向一輝, 佐藤翔, 桂井麻里衣. 第16回Webインテリジェンスとインタラクション研究会, スタートアップ賞, 2020年11月.
  6. 廣中詩織, 吉田光男, 梅村恭司. 第14回Webインテリジェンスとインタラクション研究会, スタートアップ賞, 2019年6月.
  7. Hayato Okumoto, Mitsuo Yoshida, Kyoji Umemura, Yuko Ichikawa. The 2018 International Conference On Advanced Informatics: Concepts, Theory And Application, Best Paper Award, August 2018.
  8. 鳥海不二夫, 吉田光男. 第12回Webインテリジェンスとインタラクション研究会, 優秀研究賞, 2018年6月.
  9. 佐藤翔, 吉田光男. 情報知識学会, 第15回論文賞, 2018年5月.
  10. 山口太一, 角田孝昭, 吉田光男, 津川翔, 山本幹雄. 第3回コミュニケーションクオリティCQ基礎講座ワークショップ, 最優秀研究賞, 2017年1月.
  11. 前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠. 第9回Webインテリジェンスとインタラクション研究会, ステージ発表賞, 2016年12月.
  12. 吉田光男, 荒瀬由紀. 第9回 Webとデータベースに関するフォーラム, 論文賞 runners-up, 2016年9月.
  13. 前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠. 人工知能学会, 研究会優秀賞, 2016年6月.
  14. 風間一洋, 谷直樹, 榊剛史, 吉田光男. 第7回Webインテリジェンスとインタラクション研究会, 萌芽研究賞, 2015年11月.
  15. 前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠. 第7回Webインテリジェンスとインタラクション研究会, 学生奨励賞, 2015年11月.
  16. 吉田光男. 日本学生支援機構, 特に優れた業績による返還免除(半額), 2011年5月.
  17. 吉田光男. 筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻, 専攻長表彰, 2011年3月.
  18. 角田孝昭, 澤田健都, 吉田光男. 第3回楽天研究開発シンポジウム, 最優秀データチャレンジ賞, 2010年12月.
  19. 吉田光男, 乾孝司, 山本幹雄. 楽天研究開発シンポジウム2009, 優秀論文賞, 2009年11月.
  20. 吉田光男, 山本幹雄. 第1回データ工学と情報マネジメントに関するフォーラム, 優秀インタラクティブ賞, 2009年3月.

研究資金(外部資金)

競争的外部資金(科研費)

  1. 日本学術振興会, 科学研究費補助金(基盤研究(B)・代表). 学術情報の早期評価のための指標統合. 2023年4月-2027年3月.
  2. 日本学術振興会, 科学研究費補助金(基盤研究(B)・代表). 利用者の研究練度に応じた多様な観点を統合する学術情報システム. 2019年4月-2023年3月.
  3. 日本学術振興会, 科学研究費補助金(若手研究(B)・代表). ソーシャルメディアにおける学術文献言及量予測モデルの構築. 2016年4月-2018年3月. (2019年3月まで延長)
  4. 日本学術振興会, 科学研究費補助金(特別研究員奨励費・代表). 時空間メタデータ検索をキーワード検索に統合したウェブ検索エンジンの実現. 2011年4月-2014年3月.
  1. 日本学術振興会, 科学研究費補助金(基盤研究(B)・分担). 報道・議論の視点に着目した情報獲得支援に関する研究. 2021年4月-2025年3月.
  2. 日本学術振興会, 科学研究費補助金(基盤研究(C)・分担). 地方議会会議録を核とした発言地域情報付きテキストコーパスの定量分析. 2017年4月-2020年3月. (2018年から参加)
  3. 日本学術振興会, 科学研究費補助金(基盤研究(C)・分担). ソーシャルメディアにおける情報伝達現象理解のためのネットワーク解析と可視化. 2017年4月-2020年3月.
  4. 日本学術振興会, 科学研究費補助金(基盤研究(B)・分担). 議論の背景・過程・結果を関連づける地方政治コーパスの構築とその学際的応用. 2016年4月-2020年3月.
  5. 日本学術振興会, 科学研究費補助金(基盤研究(B)・分担). 歴史認識・領土問題を巡る世論とメディア環境に関する学際的日韓比較研究. 2015年7月-2019年3月. (2016年から参加)

競争的外部資金(科研費以外)

  1. 国立情報学研究所, 2020年度国立情報学研究所公募型共同研究. GIS・SNSデータを用いた重要伝統的建造物群保存地区の分析. 2020年4月-2021年3月.
  2. 国立情報学研究所, 2019年度国立情報学研究所公募型共同研究. 科学報道記事分析のための典拠論文データセットの構築. 2019年4月-2020年3月.
  3. 国立情報学研究所, 平成30年度国立情報学研究所公募型共同研究. 科学報道記事の信頼性分析のための典拠文献自動探索. 2018年4月-2019年3月.
  4. 国立情報学研究所, 平成29年度国立情報学研究所公募型共同研究. ウェブにおける言及行動をもとにした学術雑誌の評価. 2017年4月-2018年3月.
  5. 国立情報学研究所, 平成28年度国立情報学研究所公募型共同研究. 学術情報サービスにおける閲覧行動とウェブにおける言及行動を横断した文献注目度の分析. 2016年4月-2017年3月.
  6. 楽天技術研究所, 研究奨励金(楽天研究開発シンポジウム2009). CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得. 2009年11月.
  1. 日本学術振興会, 学術知共創プログラム(課題B:分断社会の超克). 偽情報と政治的分断に関する東アジア諸国を中心とした包括的研究. 2023年7月-2029年3月.
  2. 科学技術振興機構, 未来社会創造事業 探索加速型/本格研究 「超スマート社会の実現」領域(異分野共創型のAI・シミュレーション技術を駆使した健全な社会の構築). 人間中心の社会共創デザインを可能とするデジタル社会実験基盤技術の開発. 2023年4月-2028年3月.
  3. 科学技術振興機構, 未来社会創造事業 探索加速型/探索研究 「超スマート社会の実現」領域(異分野共創型のAI・シミュレーション技術を駆使した健全な社会の構築). 社会リスク可視化システム、及び社会リスクに適切に対応する意思決定システムの開発. 2020年11月-2023年3月. (2024年3月まで延長)

民間企業等共同研究(共同研究費あり)・寄付金

プロジェクト参画(研究協力者等)

  1. 科学技術振興機構, 社会技術研究開発センター(RISTEX)「SDGsの達成に向けた共創的研究開発プログラム(情報社会における社会的側面からのトラスト形成)」. 可視化によるトラスト形成:パーソナライズされたデジタル情報空間のリテラシー教育. 2023年11月-2027年3月.
  2. 科学技術振興機構, 社会技術研究開発センター(RISTEX)「科学技術の倫理的・法制度的・社会的課題(ELSI)への包括的実践研究開発プログラム(RInCA)」. 現代メディア空間におけるELSI構築と専門知の介入. 2020年9月-2024年3月.
  3. 科学技術振興機構, 社会技術研究開発センター(RISTEX)「人と情報のエコシステム(HITE)」. PATH-AI:人間-AIエコシステムにおけるプライバシー、エージェンシー、トラストの文化を超えた実現方法. 2020年1月-2022年12月.

太字は継続中の研究資金です。民間企業との共同研究も積極的に実施しており,特に新規事業のための研究開発に携わるケースが多いです(自身も起業経験があり,会社代表を兼業しています)。お気軽にお問い合わせ下さい。共同研究の進め方や支援内容については「豊橋技術科学大学とGunosyの共同研究~産学連携は何をもたらすのか」にまとまっています。

メディア掲載

メディア報道 - researchmap

他にもサービス(Ceek.jp, Ceek.jp News など)が雑誌にて多数紹介されています。

連絡先

E-Mail
mitsuo [at] gssm {dot} otsuka [dot] tsukuba {dot} ac [dot] jp
居室
筑波大学 東京キャンパス文京校舎 6階 626室

所属・活動

筑波大学

有限会社てっくてっく

科学技術・学術政策研究所

理化学研究所 革新知能統合研究センター

東京大学

学会・研究会

太字は継続中の委員です。

国際会議・ワークショップ・特集号

太字は継続中の委員です。

その他

外部サイト