OpenAI

OpenHands 入門ガイド — 無料・オープンソースの AI コーディングエージェントを自分の PC で動かす

OpenHands 入門ガイド — 無料・オープンソースの AI コーディングエージェントを自分の PC で動かす OpenHands とは OpenHands（旧 OpenDevin）は、AI が自律的にコードを書き、デバッグし、テストを実行するオープンソースのコーディングエージェントです。MIT ライセンスで完全無料、GitHub で 68,000 スター以上を獲得し、479 名以上のコントリビューターが参加しています。簡単に言えば、「Claude Code や Devin のオープンソース版」です。自然言語で「この関数のテストを書いて」「このバグを直して」と指示するだけで、AI がファイルを読み、コードを編集し、ターミナルでコマンドを実行して、タスクを完了させます。 LLM・ランタイム・エージェントの 3 層構造における位置づけ AI ツールを理解する上で、3 つの層を区別することが重要です。あなた ↓ 「このバグを直して」エージェント（OpenHands） ← コードを読み、修正し、テストを実行する「ドライバー」 ↓ 「この質問を LLM に投げて」ランタイム（Ollama 等） ← LLM を動かす「エンジン」 ↓ LLM（Qwen3, Claude 等） ← 回答を生成する「頭脳」層役割 OpenHands の場合 LLM 言語理解・コード生成 Claude, GPT, Qwen3 など（選択可能）ランタイム LLM の実行環境 Anthropic API / OpenAI API / Ollama エージェント自律的にタスクを遂行 OpenHands がここ OpenHands の最大の特徴はモデル非依存であることです。クラウド API（Claude, GPT）でも、ローカル LLM（Ollama + Qwen3）でも動作します。 ...

.envの代わりにlkrでLLM APIキーを安全に管理する — セットアップからClaude Code連携まで

.env の代わりに lkr で LLM API キーを安全に管理する — セットアップから Claude Code 連携まで AI エージェントがローカルファイルを読み書きする時代、.env に平文で置いた API キーが LLM のコンテキストに載るリスクが現実のものになっています。前回の記事ではこの問題の全体像を、aws-vault の記事では AWS 認証情報の保護を解説しました。本記事では、LLM Key Ring（lkr）を使って LLM API キーを安全に管理する具体的な手順を解説します。aws-vault が AWS 認証情報に特化しているのに対し、lkr は OpenAI・Anthropic・Google など LLM API キーの管理に特化したツールです。 lkr が解決する問題 .env に LLM API キーを置くリスク多くの開発者は .env ファイルに API キーを平文で保存しています。 1 2 3 # .env（平文で保存されている） OPENAI_API_KEY=sk-proj-xxxxxxxxxxxxxxxxxxxx ANTHROPIC_API_KEY=sk-ant-xxxxxxxxxxxxxxxxxxxx このファイルには4つの攻撃ベクトルがあります。攻撃ベクトル説明 Git への混入 .gitignore に頼るヒューマンエラー。うっかりコミットは後を絶たないシェル履歴への漏洩 export OPENAI_API_KEY=sk-... が ~/.bash_history に残るプロセス情報への露出 ps コマンドで環境変数が見える AI エージェントによる抽出 Claude Code がファイルを読み取り、LLM の API リクエストに含まれる 4番目が AI 時代に特有の脅威です。Claude Code は.env ファイルを自動的に読み込むことが確認されており、API キーが意図せず Anthropic のサーバーに送信されるリスクがあります。 ...

「AIが覚醒する魔法の言葉」は本当に効くのか — プロンプトエンジニアリングの実態と公式ガイドの教え

「AIが覚醒する魔法の言葉」は本当に効くのか — プロンプトエンジニアリングの実態と公式ガイドの教え @fit_youtubead 氏のポストが、Claude と ChatGPT で使える「魔法のプロンプト」を紹介し、大きな反響を呼んでいます。「最高の専門家として、思考プロセスを分解し、初心者にも再現できる形で5ステップで出力してください」これだけ。なぜ強いのか？理由は3つ。役割を与える → AIの精度が跳ね上がる思考を分解させる → 中身が薄くならない再現性を指定する → 実用的で使えるアウトプットになる確かに、雑な指示よりも構造化された指示の方が良い結果を得られるのは事実です。しかし「魔法の言葉」と呼ぶには、いくつか知っておくべきことがあります。本記事では、ツイートで紹介された3つのテクニックを、Anthropic と OpenAI の公式ガイドおよび研究論文に照らし合わせて検証します。テクニック1: 役割を与える（ロールプロンプティング）「最高の専門家として」のように、AI に特定の役割やペルソナを与えるテクニックです。公式ガイドの見解 Anthropic はプロンプトエンジニアリングのベストプラクティスで、ロールプロンプティングを推奨テクニックの1つとして挙げています。「法律アドバイザー」「データアナリスト」「カスタマーサポート担当」のように、具体的な文脈に合わせてモデルの声とふるまいを調整する手法です。 OpenAI も公式ガイドでシステムプロンプトによる役割設定を推奨しています。研究が示す実態ところが、学術的な研究を見ると、ロールプロンプティングの効果は「場合による」というのが正確な答えです。研究結果対象モデル Better Zero-Shot Reasoning with Role-Play Prompting AQuA データセットで精度が53.5%→63.8%に向上（+10.3pt） GPT-3.5 ExpertPrompting 詳細な専門家ペルソナが単純なペルソナを大幅に上回る複数モデル When “A Helpful Assistant” Is Not Really Helpful 追加のペルソナは性能を向上させない 4モデルファミリー Persona is a Double-edged Sword GPT-4ではペルソナの有無で差は最小限 GPT-4 PromptHub の検証記事は、これらの研究を総合して以下のように結論づけています。創作的なタスク（文体の調整、トーンの統一）では効果がある精度ベースのタスク（分類、計算、ファクトチェック）では、新しいモデルほど効果が薄い「天才ペルソナが愚か者ペルソナより劣る」という矛盾した結果も報告されているつまり、「専門家として」と付けるだけで「精度が跳ね上がる」わけではありません。効果があるのは、役割指定によってモデルの出力スタイルや視点が適切に制約されるケースです。 ...

AI が書いた CLAUDE.md は逆効果 --- 「コンテキストファイルの自動生成は精度を下げる」という研究

AI が書いた CLAUDE.md は逆効果 — 「コンテキストファイルの自動生成は精度を下げる」という研究 @at_sushi_（門脇敦司）氏が X で投稿した、AI 生成のプロンプトファイルに関する記事が注目を集めています。 CLAUDE.md のようなプロンプトファイルを AI に生成させると「逆に精度が下がる」という研究です。AI 文書は冗長で、AI 自身を混乱させます。では、どうすればいいのか？というと、「本当に重要な情報だけを、開発者が書く」というのが現在の正解です元記事は Zenn の解説記事で、ETH Zurich と LogicStar.ai の研究チーム（Gloaguen et al.）による論文「Evaluating AGENTS.md: Are Repository-Level Context Files Helpful for Coding Agents?」を日本語で紹介しています。本記事では、この研究の実験データを詳しく読み解き、CLAUDE.md / AGENTS.md の書き方への実践的な示唆を整理します。研究の概要 — 何を検証したのか背景 CLAUDE.md、AGENTS.md、CURSORRULES — これらの「コンテキストファイル」は、AI コーディングエージェントにリポジトリの慣習や制約を伝えるための指示書です。Anthropic、OpenAI、Cursor はいずれもこれらのファイルの作成を強く推奨しています。しかし、「コンテキストファイルは本当にエージェントの性能を向上させるのか?」という基本的な問いに対して、厳密な検証はこれまで行われていませんでした。実験設計 ETH Zurich の研究チームは、3 つの条件で比較実験を実施しました。条件内容なし（None）コンテキストファイルなし（ベースライン） LLM 生成エージェント開発者の推奨に従い LLM に自動生成させたファイル人間作成開発者がリポジトリにコミットしたファイル評価対象モデル: Claude Code（Sonnet 4.5）、Codex（GPT-5.2 / GPT-5.1 mini）、Qwen Code（Qwen3-30b-coder） ...

Amazon Bedrock が OpenAI API 互換を提供開始 --- Mantle 推論エンジンが「モデルの交換可能性」を実現する

Amazon Bedrock が OpenAI API 互換を提供開始 — Mantle 推論エンジンが「モデルの交換可能性」を実現する @publickey が X で投稿した、Amazon Bedrock の OpenAI API 互換機能に関するブログ記事が話題を呼んでいます。ブログ書きました：「Amazon Bedrock」でOpenAI API互換を提供開始。オープンウェイトな基盤モデルでOpenAI SDKが利用可能に Publickey の元記事によると、AWS は Amazon Bedrock の Mantle 推論エンジンで OpenAI API 互換機能の提供を開始しました。これにより、開発者は使い慣れた OpenAI SDK をそのまま Amazon Bedrock 上で利用できるようになります。この動きは単なる「API の互換性」にとどまらず、AI 業界の構造を変える可能性を持っています。本記事では、Mantle 推論エンジンの技術的な仕組みと、この互換性がもたらす業界への影響を掘り下げます。 Mantle 推論エンジンとは何か分散推論の基盤 Mantle は、Amazon Bedrock のために構築された大規模モデル向け分散推論エンジンです。単なる API ラッパーではなく、以下の機能を内包する本格的な推論インフラです。機能説明サーバーレス推論容量管理を自動化し、デフォルトのクォータを引き上げ OpenAI API 互換 Chat Completions API / Responses API をネイティブサポートステートフル会話管理会話履歴をサーバー側で保持（Responses API）非同期推論長時間実行ワークロードのバックグラウンド処理ストリーミングリアルタイムのレスポンス生成に対応ゼロオペレーターアクセス NitroTPM による暗号学的な実行環境保証セキュリティ設計 Mantle のセキュリティ設計は注目に値します。EC2 インスタンス証明（Instance Attestation）機能を活用し、顧客データ処理のための硬化された不変のコンピュート環境を構成しています。Nitro Trusted Platform Module（NitroTPM）による暗号署名付き証明測定で、モデルの重みと推論オペレーションを保護します。 ...

AIチャットボットのプライバシー問題 — スタンフォード大学の研究が暴いた6社の構造的欠陥

AIチャットボットにあなたのプライバシーは存在しない — スタンフォード大学が暴いた構造的欠陥スタンフォード大学の研究チームが、米国の主要AIチャットボット6社のプライバシーポリシーを体系的に分析した論文 “User Privacy and Large Language Models” を発表しました。その結論は明確です——全6社がユーザーの会話データをデフォルトでモデル学習に利用しており、実効的な保護は極めて限定的です。論文概要項目内容タイトル User Privacy and Large Language Models: An Analysis of Frontier Developers’ Privacy Policies 著者 Jennifer King, Kevin Klyman, Fotis Gaspelos, Tiffany Saade, Victoria Bhatt 所属 Stanford University 発表 2025年10月（AAAI AIES 掲載）論文 arXiv:2509.05382 対象6社企業チャットボット Amazon Nova Anthropic Claude Google Gemini Meta Meta AI Microsoft Copilot OpenAI ChatGPT 1. データの「統合」—— 会話が資産として再利用される構造全6社がデフォルトでモデル学習に利用 Anthropic は長らく「消費者の会話データを学習に使わない」と差別化していましたが、2025年9月にオプトイン → オプトアウトへ転換。これにより全6社がデフォルト学習利用に揃いました。 ...

# 【2026年最新】世界一わかりやすい Agent Skills 完全ガイド — まとめ

【2026年最新】世界一わかりやすい Agent Skills 完全ガイド — まとめ元記事: 【2026年最新】世界一わかりやすいAgent Skills完全ガイド（株式会社AIworker）紹介ポスト: Fujin(@fujin_metaverse) Agent Skills とは？一言で言うと、「AIエージェントに渡す新人研修マニュアル」。会社の新入社員にマニュアルを渡すのと同じ要領で、SKILL.md というテキストファイルに「やり方」を書いて所定のフォルダに置くだけ。AIエージェントが自動的にそれを見つけて読み込み、指示通りに仕事をしてくれる。 2025年12月に Anthropic がオープンスタンダードとして公開 Claude, GitHub Copilot, OpenAI Codex, Cursor など主要AIツールが対応 2026年2月時点でマーケットプレイス登録数は20万件超なぜ Agent Skills が必要か — プロンプトの3つの限界従来のプロンプト運用には以下の限界があった。Agent Skills はこれらを全て解決する。限界問題 Agent Skills での解決毎回同じ説明が必要技術スタック、規約、コミットルールを毎回ゼロから伝える一度書けば繰り返し使えるチーム共有できない優れたプロンプトがチャット履歴に埋もれる Git で管理・共有可能コンテキスト圧迫毎回全情報を読み込むと、肝心のタスクの余裕が減る必要な時に必要な分だけ読み込む「段階的開示」 Claude Code のセットアップ手順 Agent Skills を使う最も一般的な環境は Claude Code（Anthropic 提供のターミナル型AIコーディングツール）。ブラウザ版の Claude.ai と違い、PCのファイルを直接読み書きできるのが特徴。 1 2 3 4 5 6 7 8 9 10 11 12 # 1. Node.js の確認（v18.0.0 以上が必要） node --version # 2. Claude Code のインストール（Mac / Linux） curl -fsSL claude.ai/install.sh | bash # 3. 確認 claude --version # 4. 初回起動（ブラウザでログイン画面が開く） mkdir ~/my-project && cd ~/my-project claude SKILL.md の書き方 SKILL.md は YAMLフロントマター + Markdown 本文の2部構成。 ...

Vibe Coding 2.0 — 「何を作らないか」を知る 18 のルール

Vibe Coding 2.0 — 「何を作らないか」を知る 18 のルール Vibe Coding とは（前提知識） Vibe Coding は、Andrej Karpathy（OpenAI 共同創設者）が 2025 年初頭に提唱した概念で、「コードの細部を手で書く」のではなく、AI に自然言語で指示してコードを生成させ、“ノリ（vibe）“で開発を進めるスタイルを指します。Cursor や Claude Code などの AI コーディングツールの普及とともに広まりました。 MVP とは MVP（Minimum Viable Product / 実用最小限の製品）とは、顧客に価値を提供できる最小限の機能だけを備えた製品のことです。完璧な製品を作り込んでからリリースするのではなく、核となる機能だけを素早く形にして市場に投入し、実際のユーザーからフィードバックを得ながら改善していくアプローチを指します。目的: アイデアが市場に受け入れられるかを、最小のコストと時間で検証する考え方: 「完成品」ではなく「検証のための道具」。100 点を目指すのではなく、60 点で出して学ぶ例: 動画配信サービスなら、レコメンド機能や検索機能を後回しにして、まず「動画を再生できる」だけのアプリをリリースする Vibe Coding 2.0 の文脈では、AI ツールを活用して MVP を高速にシップ（出荷）することが繰り返し強調されています。以下のルール群は、すべて「いかに早く MVP を世に出すか」を軸に設計されています。 Vibe Coding 2.0 とは Harshil Tomar 氏が X で投稿した「Vibe Coding 2.0: 18 Rules to be the Top 1% builder」は、Vibe Coding の「次のフェーズ」を定義したものです。 ...

Azure OpenAI

Azure OpenAI Azure OpenAI Service申請について

ChatGPT: PowerPoint生成

CHatGPT PowerPoint 生成 How to build: an AI PowerPoint generator (Next.js, OpenAI, CopilotKit) https://github.com/CopilotKit/CopilotKit