← 一覧へ

回答者 R0200

idR0200
ID200
開始時刻2026-02-20 00:32:30
完了時刻2026-02-20 00:56:15
メールanonymous
名前
言語日本語
最終変更時刻
氏名 Name沓村憲樹
所属(教員組織)※学生は指導教員の所属を選択 /Affiliation (Faculty/Organization)数理物質系/Faculty of Pure and Applied Sciences
専門分野/ Research Field創薬化学、有機合成化学、天然物合成化学、複素環合成化学
以下の項目から選んでください。 Please select from the options below.教員・研究員/ Faculty Member / Researcher
職位 Position教授
(大学院生のみ回答)指導教員名/ Name of Academic Supervisor (for graduate students only)
(大学院生のみ回答)本アンケートへ研究情報や研究データ情報を入力することを指導教員に確認しましたか? Have you confirmed with your academic supervisor that you are entering research information and/or research data information in this questionnaire?
2-1研究へのAIの活用経験と意識(当てはまるものを選んでください)/Experience with and Perceptions of AI Utilization in ResearchAIを活用してみたい、今後活用により研究加速を考えている/I would like to use AI and am considering accelerating my research through its use in the future.
3-1 AI を活用することで推進したい(推進した)研究テーマを回答ください。(1テーマ40字程度)Please describe the research theme(s) you would like to promote (or have promoted) by utilizing AI.フラボノイド骨格合成反応の基質適用範囲(Scope)予測AIの開発
3-2 AIを活用することで解決したい(解決した)学術的課題の概要を教えてください(分野外の専門家がわかるように。1テーマ100〜300字程度)Please provide an overview of the academic challenge(s) you would like to address (or have addressed) by utilizing AI.有機合成反応の論文には著者が選んだ基質での結果表(scope table)が掲載されるが、読者が知りたい「自分の基質でも使えるか」には限られた情報しか提供しない。個々の反応については化学者の経験的判断で対処できるが、数百論文にまたがるデータを横断的に統合し、基質の構造特徴量空間上で反応条件の適用境界を定量的に描き出すことは、人間の認知限界を超える。本研究では、生物活性化合物として重要なフラボノイド骨格の合成反応を対象に、文献ビッグデータから基質適用範囲を自動予測するAIモデルを開発する。これにより、反応の「本当の適用範囲」を定量的に可視化する新たな方法論を確立する。
3-3 以下内容がわかる場合は具体的に教えてください。1.研究テーマで AI が特に有効または改善ができる部分はどこ(何)でしょうか?2.AIを活用することによって、研究分野にどのようなインパクトをあたえられるでしょうか?If possible, please provide specific details on the following points: 1Which part(s) ...1.AIが特に有効な部分 文献数百件から抽出した数千の基質・条件・収率データを統合し、50次元以上の分子記述子空間で反応の成否境界を学習する工程である。化学者は個々の論文を読んで個別判断はできるが、数百論文を横断して(たとえば)「Hammett σが0.45を超えかつ立体パラメータA値が2.0以上の領域で成功率が急落する」といった多変数間の交互作用パターンを統計的に抽出することは不可能である。AIはこの規模のデータ統合と多次元パターン認識を実現し、人間には見えなかった反応適用範囲の定量的な境界を明らかにすることができる(と思う)。 2.研究分野へのインパクト 従来、反応の有用性は「scope tableに載っている基質が多い」という定性的評価に留まっていた。本研究により、基質特徴量空間上のカバレッジとして反応の適用範囲を定量評価する新基準が生まれることを期待している。これは有機合成化学における反応評価のパラダイム転換となりうる。また、開発するフレームワーク理論は、将来的にフラボノイド合成に限らずあらゆる有機合成反応に展開可能であり、私の専門分野である創薬化学での誘導体合成計画における事前スクリーニングツールとしても実用的価値が高い。データセットと学習パイプラインを公開することで、分野全体のscope理解の体系的進展に貢献する。
3-4 現時点で AI for Science チャレンジ型に応募したいと思いますか?At this point, would you like to apply for the AI for Science Challenge–type program?共同研究先が見つかれば応募したい I would like to apply if a suitable collaborative research partner is found.
3-5 ご自身の研究活動にAIを導入・活用するときの課題があれば教えてください。支援構築の参考にします。(複数選択可)If you have any challenges or concerns regarding the introduction or use of AI in your own research activities, please let us know.相談できる相手がいない/AI専門研究者への伝手がない I do not have anyone to consult with / I have no connections to AI specialist researchers.;データ整理・前処理が大変そう Data organization and preprocessing seem difficult and time-consuming.;「チャレンジ型」公募に自分の研究が合うか判断できない I cannot determine whether my research is suitable for a “challenge-based” funding program.;
3-6 上記テーマのためのデータは既に取得済みですか? Have the data for the above research theme already been collected?データは既に取得済み、取得途中・公開データ・パブリックデータを活用予定 / The data have already been collected. The data are currently being collected, or we plan to use existing open or public datasets.
4-1 今後AI活用したい(これまでAI活用した)研究データについて取得先や収集手法について可能な範囲で教えてください。 Please describe, to the extent possible, the sources and collection methods of the research data that you would like to use (or have us...本研究に関する少量の実験データは有しているが、基本的に本研究では自らの実験データではなく、既存の学術文献データベースから反応データを収集することを考えている。主要なデータ源としてSciFinder-n(Chemical Abstracts Service)の反応検索機能を用いる。基質構造・生成物構造による検索で対象に考えている3反応(フラボノイド骨格を構築するのに利用頻度の高い3反応)の文献を系統的に収集し、各論文のscope tableから基質SMILES、反応条件(試薬・溶媒・温度・時間)、収率、選択性を抽出・標準化する。補完的にGoogle ScholarおよびWeb of Scienceによるキーワード検索を行い、SciFinder-nでカバーされにくい古典的文献やマイナー誌の報告を網羅する。各反応について100〜300件の論文から500〜2000データ点の収集を目標とする。基質の分子記述子(電子的・立体的・物性パラメータ等)はRDKit(オープンソース化学情報ツールキット)により構造式から自動計算する。基本的にすべて査読済み論文に基づくため品質が担保されており、新たな実験は不要と考えている。
4-2 以下を参考にデータの種類等を可能な範囲で教えてください。 観測データ / 実験データ / 測定データ 画像 / 音声 / 動画 / テキスト / 時系列 数値シミュレーション結果 センサーデータ 行動データ / 社会調査・アンケートデータ (横断的にデータ取得/縦断的:一人物に複数点) 文献データ / デジタルアーカイブ その他 Please descr...実験データ、文献データ、デジタルアーカイブ
4-3 その他、保有している研究データについて、取得先や取得手法について可能な範囲で教えてください。 In addition to the above, please describe, to the extent possible, the sources and collection methods of any other research data you possess.
4-4 下記を参考に、データの種類等を可能な範囲で教えてください。 観測データ / 実験データ / 測定データ 画像 / 音声 / 動画 / テキスト / 時系列 数値シミュレーション結果 センサーデータ 行動データ / 社会調査・アンケートデータ (横断的にデータ取得/縦断的:一人物に複数点) 文献データ / デジタルアーカイブ その他 Please descr...
4-5 データの基本情報(サンプル数、説明変数、目的変数)について教えてください。Please provide basic information about the data, such as the number of samples, explanatory variables (independent variables), and target variables (depend...サンプル数: 3種の合成反応について、学術論文から合計約2,000〜3,500件の反応結果データを収集する。1件のデータは「どの原料に、どの条件で反応させたら、どうなったか」という1回の反応実験の記録に相当する。 説明変数: 論文から原料分子の構造式と反応条件(触媒の種類、溶媒、温度など)を取得する。構造式からは計算ソフト(RDKit)を用いて分子の特徴(電子の偏り、大きさ、脂溶性など50〜100種類の数値)を自動算出する。反応条件も数値に変換し、これらを組み合わせて説明変数とする。 目的変数: まずは論文に記載された収率から判定する「反応が成功したか失敗したか」(二値分類)。発展課題として収率の数値予測や生成物の種類の予測、環化の選択性などにも取り組む。
4-6 これまでデータへ適応した解析手法や統計手法・モデル等があれば教えてください。Please describe any analytical methods, statistical techniques, or models that have been applied to the data so far, if applicable.
4-7 データの信頼性について次の点を記述してください。例)・測定精度/誤差範囲/ノイズがあればその特徴、もしくは、専門家によるアノテーションが必要かどうか Please describe the reliability of the data, addressing the following points as appropriate. Examples: Measurement a...
4-8 データの偏りについて次の点を記述してください。例・属性の偏りがあればどんなものか/サンプルサイズの偏りがあればどんなものか/データの揺らぎがあればどんなものか Please describe any biases present in the data, addressing the following points as appropriate. Examples: Types...
4-9 データの構造・複雑性について以下から教えてください。(複数選択可) Please indicate the structure and complexity of the data by selecting from the options below. (Multiple answers allowed)多変量性 Multivariate;線形・非線形 Linear / Nonlinear;階層構造 Hierarchical structure;次元性 High dimensionality;
5-1 専門分野(複数選択可)Classification of AI Research
5-2 現在の主要研究テーマをご記入ください。 (1テーマにつき100〜300字程度) Please describe your current main research theme(s).