Bpifrance · POC
イノベーション / ディープテック — データと分析
DeepTech — PDF ファイルからエコシステム グラフまで
何百ものアプリケーション ファイルをクエリ可能なエンティティと関係に構造化し、ソース ドキュメントまで遡って追跡可能にして、研究に基づいたイノベーションを推進します。
コンテクスト
Bpifrance の DeepTech 部門は、研究から生じるイノベーションをサポートしており、元の研究所、知的財産の移転、資金調達、コラボレーション、分野別の軌跡など、スタートアップがどのように出現するかを理解する必要があります。これらの信号は、サポート システム、活動レポート、公共政策の決定に影響を与えます。
コーパスはすでに存在しており、自然言語で数年にわたるアプリケーション ファイルになっていますが、その大部分は PDF に閉じ込められたままであり、再現可能な方法での相互参照、集約、再検索が困難です。
問題のある
新興企業、研究機関、特許、学校、資金との間のつながりは、いかなる構造化された形でも存在しませんでした。大規模な国家組織に属するプロジェクトのシェアを継続的に定量化したり、創発経路における知財移転の重みを測定したりすることは不可能です。
それぞれの戦略的質問には、限られたサンプルを手作業で掘り下げることが含まれていました。コホート分析には数週間かかり、再現性がなく、フランスのディープテックエコシステムの全体的なビジョンは得られませんでした。
アプローチ
- ビジネス リポジトリ (ノードと関係の類型 - 研究室、企業、人材、特許、資金調達、コラボレーションなど) の共同構築を DeepTech チームと繰り返し、他のコーパスで再利用可能な AI Knowledge Vault に活用しました。
- すべてのファイルに対する生成 AI による抽出: エンティティとリンクの識別、モデル間の品質調整、SQL、ダッシュボード、インタラクティブ グラフで使用できるリレーショナル ストレージ (ノード/エッジ)。
- 証拠パネル: 表示される各関係または属性は、元のファイルのソース文にリンクされています。委員会での回答はもはや直感ではなく、正当化されます。
- HITL ループ: 専門家が疑わしいノードと関係を検証、修正、または削除します。グラフはブラックボックスのままではなく、レビューの過程で改良されます。
- 意思決定指向の調査: コホート、アクターネットワーク、連続起業家、およびセクター間の相関関係に関するクエリ。復元を加速するために自然言語から視覚化を生成します。
結果
- かつては何週間も手作業で読まないとアクセスできなかった質問が、各洞察についてソースの一節が引用され、コーパス全体にわたってクエリ可能になります。
- 定性的な資料しか存在しなかったエコシステムに関する定量的な指標(大規模な研究機関とのつながり、知財リンクの分布、コースにおける高等教育の比重)の出現。
- 工業化可能なコホート分析とネットワーク分析: 同じ方法、同じ範囲で、レポート作成ごとに再現可能です。
- 拡張可能なベース: 他のドキュメンタリー セット (国家プログラム、グリーンテック、産業) で再利用可能であり、内部データ ロードマップ (「企業」マッピング) に合わせたリポジトリとパイプライン。
パブリック境界
ノードと関係の正確な量、詳細なリポジトリの類型、精度のメトリクス、二酸化炭素排出量は、このショーケース ページでは公開されていません。大規模なドリフトを監視するには、サンプリングによるビジネス管理が依然として必要です。
クライアントの同意を得て提出されたケース。運用の詳細、データ、ビジネスパラメータはこのページでは開示されていません。
次の儀式を構築する
ビジネスが期待する範囲、データ、証拠を調整するためのフレームワークを計画します。