CodeT5とCodeT5+は、Salesforce Researchによって開発されたコード理解と生成のためのAIモデルです。これらのモデルは、以下の論文で紹介されています。
「CodeT5+: Open Code Large Language Models for Code Understanding and Generation」 著者: Yue Wang*, Hung Le*, Akhilesh Deepak Gotmare, Nghi D.Q. Bui, Junnan Li, Steven C.H. Hoi (*は同等の貢献を示す)
「CodeT5: Identifier-aware Unified Pre-trained Encoder-Decoder Models for Code Understanding and Generation」 著者: Yue Wang, Weishi Wang, Shafiq Joty, Steven C.H. Hoi
実際には、CodeT5とCodeT5+モデルは、AI搭載のコーディングアシスタントとして展開され、ソフトウェア開発者の生産性を高めることができます。Salesforceでは、CodeT5をVS Codeプラグインとして使用してAIコーディングアシスタントのデモを作成し、以下の3つの機能を提供しています。
- テキストからコードの生成: 自然言語の説明に基づいてコードを生成します。
- コードの自動補完: 目標の関数名が与えられた場合、コードの全体の関数を完成させます。
- コードの要約: 自然言語の説明で関数の要約を生成します。
新着情報
- 2023年5月: CodeT5+の論文とモデルがリリースされました! 論文 | コード | モデル | ブログ
- 2022年9月: 私たちのCodeRL論文がNeurIPS 2022に採用されました! 論文 | コード | ブログ
- 2022年7月: 私たちはHuggingFaceで2つの大型CodeT5チェックポイントをリリースしました: Salesforce/codet5-largeとSalesforce/codet5-large-ntp-py、これらはCodeRL論文で紹介されています。
- 2021年10月: 私たちは論文でカバーされているすべての下流タスクの微調整チェックポイントをリリースしました。また、多言語コード要約用のCodeT5-base微調整チェックポイント(Salesforce/codet5-base-multi-sum)もリリースしました。
- 2021年9月: CodeT5論文がEMNLP 2021に採用され、モデルがリリースされました! 論文 | コード | モデル | モデルカード | ブログ
引用 このコードがあなたの研究に有用である場合、以下を引用してください。
@inproceedings{ wang2021codet5, title={CodeT5: Identifier-aware Unified Pre-trained Encoder-Decoder Models for Code Understanding and Generation}, author={Yue Wang, Weishi Wang, Shafiq Joty, Steven C.H. Hoi}, booktitle={EMNLP}, year={2021}, }
@inproceedings{ le2022coderl, title={CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning}, author={Le, Hung and Wang, Yue and Gotmare, Akhilesh Deepak and Savarese, Silvio and Hoi, Steven C. H.}, booktitle={NeurIPS}, year={2022} }
@article{ wang2023codet5plus, title={CodeT5+: Open Code Large Language Models for Code Understanding and Generation}, author={Wang, Yue and Le, Hung and Gotmare, Akhilesh Deepak and Bui, Nghi D.Q. and Li, Junnan and Hoi, Steven C. H.}, journal={arXiv preprint}, year={2023} }
ライセンス このコードはBSD-3ライセンスの下でリリースされています(詳細はLICENSE.txtを参照してください)、ただし、ユーザーは以下を尊重するように求められます。 このソフトウェアは、暴力、憎悪、分裂、環境破壊、人権侵害、または人々の身体と精神の健康の破壊を促進または利益を得るために使用されるべきではありません。
私たちは、このソフトウェアのユーザーに、このモデルの高リスクなアプリケーションを開発する際に適切なドキュメントを使用し、このソフトウェアを使用しているアプリケーションについて私たちにメールで知らせてください()。
参加方法 あなたが何か質問、提案、要求またはバグ報告がある場合、GitHubのイシューを作成してください。私たちはPRを歓迎します!
CodeT5は、コード理解と生成のためのオープンコードLLMsのホームであり、arxiv.org/abs/2305.07922で参照できます。