🤖 生成AI
生成AIのナレッジをまとめています
生成AI
主要なLLM(大規模言語モデル)の精度やコストをメモ
各社の主要LLMモデル(25年3月時点)
- OpenAI
- GPT-4o, 4.5, o1, o3
- https://platform.openai.com/docs/api-reference/introduction
- Anthropic
- Claude3.5 haiku、Claude 3.7 sonnet
- https://docs.anthropic.com/ja/docs/welcome
- Google
- Gemini 2.0 Flash、Gemini 2.0 Pro
- https://ai.google.dev/gemini-api/docs?hl=ja
- DeepSeek
- DeepSeek R1
- https://api-docs.deepseek.com/
プロンプトエンジニアリング
開発支援ツール・エージェント
Cursor: AIコードエディタ
- 概要
- 生成AIが統合されているIDE
- VS Codeをベースにしているため、VS Codeの移行やプラグインも楽
- https://www.cursor.com/ja
- 主要機能
- オートコンプリート:タブ補完、マルチライン編集、スマートリライト、カーソル予測
- チャット:クイック質問、インスタント適用、コードベース回答、コードの参照、ウェブ問い合わせ、ドキュメント活用
- エージェント:コンテキストの自動取得、コマンドの実行、エラーの繰り返し修正
Cline: コーディングエージェント
- 概要
- VS Code拡張の自律型のコーディングエージェント
- ファイル作成・編集、コマンド実行、ブラウザ操作、MCPサーバー利用などができる
- Roo Codeなど派生ツールがいろいろある
- https://github.com/cline/cline
GitHub Copilot: AIペアプログラマー
- 概要
- AIペアプログラマー
- https://docs.github.com/ja/copilot
Devin: AIチームメイト
- 概要
- SaaSの自律型のAIエージェント。スキル感はインターンからジュニアエンジニアレベル
- WebやSlackからタスクを依頼して、開発からPR作成やレビューコメント対応までまるっとお願いできる
- またブラウザ操作もできるので、調査や手動テストなども幅広い対応を依頼できる
- 価格は月$500、62時間ほど働く(時給換算で1200円ほど)
- https://devin.ai/
OpenHands: AI開発エージェント
- 概要
- OSSの自律型のAIエージェント
- コードの修正、コマンドの実行、Webの閲覧、APIの呼び出しなど人間の開発者ができることなら何でも可能
- https://github.com/All-Hands-AI/OpenHands
リサーチ
- Deep Research(OpenAI)
- 25年2月時点ではOpenAIのProプランのみ利用可能
- Deep Research(Perplexity)
- 無料でも5回利用可能
- Deep Research(Google)
ブラウザ操作
- Operator(OpenAI)
- 25年2月時点ではOpenAIのProプランのみ利用可能
- browser use
- OSSのブラウザ操作をするAIエージェント
- https://github.com/browser-use/browser-use
ライブラリ
- LiteLLM
- https://litellm.vercel.app/
- 同じInput/Outputのフォーマットで100以上のLLMを呼べる
- 複数のLLMを切り替えたいときに便利