GitHub Data Explorerは、GitHubのイベントデータを探索し、インサイトを得るためのツールです。このツールは、💡OpenAIを利用したAIエンジンにより、ユーザーがSQLの知識がなくても自然言語をSQLに変換できるようになっています。
GitHub Data Explorerは、GH ArchiveとGitHubイベントAPIをデータソースとして使用しています。GH Archiveは2011年以降のすべてのGitHubデータを収集・アーカイブし、1時間ごとに更新されます。これにより、ストリーミングでリアルタイムのデータ更新が可能です。
また、大量のデータを保存し、複雑な分析クエリを処理し、オンライントラフィックに対応できるデータベースが必要です。そこで、TiDB Cloudが選ばれています。TiDB Cloudは完全管理型のクラウドデータベースサービスで、数秒でTiDBを起動でき、従量課金制を提供しています。
しかし、AIはまだ発展途上であり、いくつかの制限があります。例えば、特定のデータベース構造やドメイン知識の欠如、大規模で複雑なクエリに対する最適なSQLステートメントの生成が困難、サービスの不安定性などが挙げられます。
ユーザーがより良いクエリ結果を得るためには、GitHubに関連する明確で具体的なフレーズを使用して質問をすることが推奨されています。