

Education
-
2024/03/25 - 2021/04/01
Doctor
Department of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University
Doctorial Dissertation: "Studies on Data-Driven Discourse Relation Recognition toward Natural Language Understanding"
[webpage] -
2021/03/23 - 2019/04/01
Master
Department of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University
-
2019/03/26 - 2015/04/01
Bachelor
Department of Electrical and Electronic Engineering, Faculty of Engineering, Kyoto University
-
High School
General Course of Ishikawa Prefectural Kanazawa Izumigaoka Senior High School

Experience
-
Present - 2024/04/01
Researcher
Nikkei Innovation Lab at Nikkei Inc.
-
2024/03/31 - 2022/04/01
JSPS DC Research Fellow (DC2)
Research Project: "Building a Commonsense Reasoning Model Considering Inference Process on Event Relational Knowledge"
[webpage] -
2022/03/31 - 2021/04/01
Information/AI/Data Science Doctoral Fellowship
[webpage]
-
2024/03/31 - 2020/10/01
Student Intern
Nikkei Innovation Lab at Nikkei Inc.
-
2021/03/31 - 2020/07/01
OA (Office Assistant)
Language Media Lab at Kyoto University
「教育研究助成に関する技術補助業務」

Publication
Refereed - Journal Paper
「基本イベントに基づく常識推論データセットの構築と利用」
大村 和正, 河原 大輔, 黒橋 禎夫
自然言語処理 Vol.30 No.4, December 2023, pp. 1206-1239
論文賞 (4/38)
[webpage]
[news]
[paper]
[webpage]
Refereed - Conference Papers
"An Empirical Study of Synthetic Data Generation for Implicit Discourse Relation Recognition"
Kazumasa Omura, Fei Cheng, and Sadao Kurohashi
In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Turin, Italy, pp. 1073–1085 (1,554/3,471)
[proceeding]
[report]
"Toward Game-Based Learning of Japanese Writing for Elementary School Students"
Kazumasa Omura, Kei Kubo, Frederic Bergeron, and Sadao Kurohashi
In Proceedings of the 31st International Conference on Computers in Education (ICCE 2023), Shimane, Japan, pp. 655-660 (accepted as a short paper, 14/33)
[proceeding]
[webpage]
[app]
[prototype]
"Improving Commonsense Contingent Reasoning by Pseudo-data and its Application to the Related Tasks"
Kazumasa Omura and Sadao Kurohashi
In Proceedings of the 29th International Conference on Computational Linguistics (COLING 2022), October 2022, Gyeongju, Republic of Korea, pp. 812-823 (522/1,563)
Outstanding Paper Award (11/634)
[ss]
[closing]
[news]
[proceeding]
[webpage]
"A Method for Building a Commonsense Inference Dataset based on Basic Events"
Kazumasa Omura, Daisuke Kawahara, and Sadao Kurohashi
In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP 2020), November 2020, Online, pp. 2450–2460 (602/2,445)
[proceeding]
[webpage]
----------
"KWJA: A Unified Japanese Analyzer Based on Foundation Models"
Nobuhiro Ueda,
Kazumasa Omura,
Takashi Kodama,
Hirokazu Kiyomaru,
Yugo Murawaki,
Daisuke Kawahara,
and Sadao Kurohashi
In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics: System Demonstrations (ACL 2023 Demo), July 2023, Toronto, Canada, pp. 538-548 (58/155)
[proceeding]
[webpage]
"A System for Worldwide COVID-19 Information Aggregation"
Akiko Aizawa,
Frederic Bergeron,
Junjie Chen,
Fei Cheng,
Katsuhiko Hayashi,
... ,
Kazumasa Omura,
... ,
Masashi Toyoda,
Nobuhiro Ueda,
Honai Ueoka,
Masao Utiyama,
and Ying Zhong (in alphabetical order)
In Proceedings of the 1st Workshop on NLP for COVID-19 (Part 2) at EMNLP 2020, November 2020, Online
[proceeding]
[website]
"Diversity-aware Event Prediction based on a Conditional Variational Autoencoder with Reconstruction"
Hirokazu Kiyomaru, Kazumasa Omura, Yugo Murawaki, Daisuke Kawahara, and Sadao Kurohashi
In Proceedings of the First Workshop on Commonsense Inference in Natural Language Processing (COIN), November 2019, Hong Kong, pp. 113-122
[proceeding]
Non-Refereed - Articles
『「基本イベントに基づく常識推論データセットの構築と利用」の研究過程』
大村 和正
自然言語処理 Vol.31 No.2, June 2024, pp. 748-754
[article]
"A Method for Building a Commonsense Inference Dataset based on Basic Events"
大村 和正
自然言語処理 Vol.28 No.1, March 2021, pp. 287-291
[article]
Non-Refereed - Others
Domestic
「検索クエリログを用いない自然な質問のマイニングの検討」
大村 和正, 石原 祥太郎
言語処理学会 第31回年次大会, March 2025, 長崎
[proceeding]
「極性と重要度を考慮した決算短信からの業績要因文の抽出」
大村 和正, 白井 穂乃, 石原 祥太郎, 澤 紀彦
言語処理学会 第29回年次大会, March 2023, 沖縄
[proceeding]
「疑似問題による常識推論能力の改善と関連タスクへの効果」
大村 和正, 黒橋 禎夫
言語処理学会 第28回年次大会, March 2022, Online
[proceeding]
「決算短信からの業績要因文の抽出に向けた業績発表記事からの訓練データの生成」
大村 和正, 白井 穂乃, 石原 祥太郎, 澤 紀彦
言語処理学会 第28回年次大会, March 2022, Online
[proceeding]
「テキストからの蓋然的関係知識の獲得と計算機および人間の学習への活用」
大村 和正, 黒橋 禎夫
京都大学第16回ICTイノベーション, February 2022, Online
「ことばつなぎゲーム:ゲーミフィケーションによる小学生の作文教育」
大村 和正, 久保 圭, 黒橋 禎夫
言語処理学会 第27回年次大会, March 2021, Online
[proceeding]
「基本イベントに基づく常識推論データセットの構築」
大村 和正, 河原 大輔, 黒橋 禎夫
言語処理学会 第26回年次大会, March 2020, Online
[errata]
----------
「単語・文・文書を統合的に扱う主観的な日本語難易度付きコーパスの構築に向けて」
前川 大輔, 大村 和正, 樽本 空宙, 石原 祥太郎, 梶原 智之
第20回言語処理若手シンポジウム (YANS2025), September 2025, 静岡
「テキスト生成モデルによる日本語形態素解析」
児玉 貴志, 植田 暢大, 大村 和正, 清丸 寛一, 村脇 有吾, 河原 大輔, 黒橋 禎夫
言語処理学会 第29回年次大会, March 2023, 沖縄
[proceeding]
「KWJA: 汎用言語モデルに基づく日本語解析器」
植田 暢大, 大村 和正, 児玉 貴志, 清丸 寛一, 村脇 有吾, 河原 大輔, 黒橋 禎夫
情報処理学会 第253回自然言語処理研究会, September 2022, 京都
優秀研究賞 (2/20)
[webpage]
[proceeding]

Misc.
[2022/09/30] 日本語解析器KWJAを公開(固有表現認識・言語素性付与・構文解析を主に担当)
[2022/01/25] 作文ゲームアプリ「いちまるとはじめよう!ことばむすび」を公開(バックエンド等を担当)
[2020/10/06] 京都大学常識推論データセットを公開
[2023/09/08] 「人を知る」人工知能講座 2023 TA
[2022/11/11,12,17,18] 「人を知る」人工知能講座 2022 TA
[2021/10/28,29,11/04,05] 「人を知る」人工知能講座 2021 TA(4-3b 入力誤り訂正 の演習も担当)
[2020/10/29,30,11/05,06] 「人を知る」人工知能講座 2020 TA
[2025/09/05] INMA 30 Under 30 Awards (30/238)
[2024/03/11] 2023年度 言語処理学会 論文賞
[2022/10/15] COLING 2022 Outstanding Paper Award
[2022/09/30] 情報処理学会 第253回自然言語処理研究会 優秀研究賞(共著)
[2022/09/02] 京都大学サマーデザインスクール 最優秀賞
[2020/02/28] 新生ハッカソン 優秀賞(総合)
[2019/09/05] Gunosy Summer Internship 2019 1st Place
[2025/02/17] 署名記事①②③(若者向けのプレスリリースの抽出と分析を担当)
[2019/03/10] TOEIC 850
Reviewer: CoNLL 2025, ARR July 2025
大会賞選考審査員: NLP2024, NLP2025