LLM | hdknr blog

Ollama で Qwen3 を動かす初心者ガイド — 日本語最強ローカルLLMを自分のPCで使う方法

Ollama で Qwen3 を動かす初心者ガイド — 日本語最強ローカル LLM を自分の PC で使う方法「ChatGPT みたいな AI を、自分の PC だけで動かせたら」と思ったことはありませんか。Ollama と Qwen3 を使えば、それが実現できます。この記事では、Saiteki AI の解説記事をベースに、初心者でもわかるように Ollama と Qwen3 の導入手順をまとめました。まず知っておきたい：LLM・ランタイム・エージェントの 3 層構造 AI の世界には、混同しやすい 3 つの概念があります。この記事で扱う Ollama と Qwen がどこに位置するかを最初に整理しましょう。レストランに例えるとお客さん（あなた） ↓ 「パスタを作って」ウェイター（AI エージェント） ← 注文を聞き、判断し、段取りを組む ↓ 「この食材でこう調理して」キッチン設備（ランタイム） ← オーブンや鍋。料理を物理的に実行する環境 ↓ シェフの腕＝レシピの知識（LLM） ← 実際に「どう調理するか」を知っている頭脳層役割具体例自分で判断するか LLM（AI モデル）言葉を理解し、回答を生成する「頭脳」 Qwen3, Llama3, Gemma2 しない（聞かれたことに答えるだけ）ランタイム LLM をメモリに読み込み、動かす「実行環境」 Ollama, vLLM, llama.cpp しない（言われた通り動かすだけ） AI エージェント LLM を使って自律的に「仕事」をこなすプログラム Claude Code, Devin, Dify する（目標に向かって複数ステップを自分で組み立てる） 3 つの関係 AI エージェント（Claude Code など） ↓ 「この質問を LLM に投げて」ランタイム（Ollama など） ↓ モデルをメモリに読み込んで推論実行 LLM（Qwen3 など） ↓ 回答を生成ランタイム → エージェントに結果を返す LLM は「頭脳」。質問されたら答えを返すが、自分からは何もしないランタイムは「エンジン」。LLM を動かすが、何を質問するかは決めないエージェントは「ドライバー」。ランタイム経由で LLM を呼び出し、結果を見て次の行動を自分で決めるこの記事で扱うのは、LLM（Qwen3）とランタイム（Ollama）の 2 つです。エージェントは含みませんが、Ollama で動かした Qwen3 を Claude Code や Dify などのエージェントのバックエンドとして使うことも可能です。 ...

OpenHands 入門ガイド — 無料・オープンソースの AI コーディングエージェントを自分の PC で動かす

OpenHands 入門ガイド — 無料・オープンソースの AI コーディングエージェントを自分の PC で動かす OpenHands とは OpenHands（旧 OpenDevin）は、AI が自律的にコードを書き、デバッグし、テストを実行するオープンソースのコーディングエージェントです。MIT ライセンスで完全無料、GitHub で 68,000 スター以上を獲得し、479 名以上のコントリビューターが参加しています。簡単に言えば、「Claude Code や Devin のオープンソース版」です。自然言語で「この関数のテストを書いて」「このバグを直して」と指示するだけで、AI がファイルを読み、コードを編集し、ターミナルでコマンドを実行して、タスクを完了させます。 LLM・ランタイム・エージェントの 3 層構造における位置づけ AI ツールを理解する上で、3 つの層を区別することが重要です。あなた ↓ 「このバグを直して」エージェント（OpenHands） ← コードを読み、修正し、テストを実行する「ドライバー」 ↓ 「この質問を LLM に投げて」ランタイム（Ollama 等） ← LLM を動かす「エンジン」 ↓ LLM（Qwen3, Claude 等） ← 回答を生成する「頭脳」層役割 OpenHands の場合 LLM 言語理解・コード生成 Claude, GPT, Qwen3 など（選択可能）ランタイム LLM の実行環境 Anthropic API / OpenAI API / Ollama エージェント自律的にタスクを遂行 OpenHands がここ OpenHands の最大の特徴はモデル非依存であることです。クラウド API（Claude, GPT）でも、ローカル LLM（Ollama + Qwen3）でも動作します。 ...

Rust の仕事が増えていく理由 — インフラコスト削減の圧力と LLM が学習コストを消し去る構造変化

Rust の仕事が増えていく理由 — インフラコスト削減の圧力と LLM が学習コストを消し去る構造変化 @helloyuki_ 氏のポストが、Zenn の記事を紹介し反響を呼んでいます（いいね 177、ブックマーク 124）。前職の同僚がなんか書いてた。広告配信でRustを採用した際のインフラ費の話を聞いた気がするんだけど、たしかにRustにするとこんなに削減できるのかと思った記憶がある🤔 引用元は yukinarit 氏による Zenn 記事「Rustの仕事が増えていく理由」。地図・ゲーム・証券・広告・メッセージングと多様な業界で Rust を使ってきたエンジニアが、なぜ Rust の仕事が増えていくのかを構造的に分析した記事です。本記事では、元記事の論点を整理し、企業の実績データとLLM時代の変化を加えて解説します。 Rust 採用の構造的理由 — 2軸モデル性能要求 × 開発コストの2軸元記事が提示するフレームワークは、言語選定を性能要求と開発コスト許容度の2軸で整理するものです。高性能要求 ↑ 領域D | 領域C Rust / C++ | ML研究等 | ───────────────┼───────────────→ 高コスト許容 | 領域B | 領域A Go / Java | Ruby / Python | TypeScript 低性能要求領域言語典型的なプロダクト A（低性能・低コスト） Ruby, Python, TypeScript Web アプリ、管理画面、MVP B（中性能・中コスト） Go, Java, C# マイクロサービス、API サーバー C（低性能・高コスト） Python + CUDA 機械学習研究 D（高性能・高コスト） Rust, C++ HFT、ゲームエンジン、広告配信領域 B → D への圧力重要なのは、クラウドの普及が領域 B のプロダクトを領域 D に押し上げていることです。オンプレミス時代はサーバーを買い切りだったため、CPU やメモリの使用効率が直接コストに響きにくかった。しかしクラウドでは CPU 時間・メモリ量が従量課金されるため、「Go/Java で十分」だったサービスがコスト削減のために Rust を検討するフェーズに入っています。 ...

ハーネスエンジニアリング実践知 — 「AIを使う人」と「AIを設計する人」の決定的な差

ハーネスエンジニアリング実践知 — 「AIを使う人」と「AIを設計する人」の決定的な差まさお(@AI_masaou) 氏が、Claude Code のハーネス（開発基盤）をテーマにした約 80 分の対談形式勉強会のまとめ記事を公開しました。新しい note を公開しました！ハーネスエンジニアリングに向き合う上で、実践的にはどうしているのか？の勉強会を行いましたのでそのまとめを記事にしました — @AI_masaou 元記事（ハーネスエンジニアリングの実践知を共有！【質問/勉強会のまとめ】）は有料コンテンツのため、本記事ではテーマであるハーネスエンジニアリングの実践知について、公開情報をもとに技術的な背景と具体的な手法を解説します。ハーネスエンジニアリングとは「ハーネス」とは馬具のことです。馬の力をそのまま放置すれば暴走しますが、ハーネスで制御すれば有用な仕事に変わります。AI エージェントも同じです。LLM の推論能力をそのまま使うのではなく、適切な制御基盤（ハーネス）で囲むことで信頼性の高い成果に変換するのがハーネスエンジニアリングです。コンピュータの構成に対応させると、位置づけがわかりやすくなります。コンピュータ AI エージェント CPU LLM（推論エンジン） OS エージェントハーネス（制御・管理基盤）アプリケーション AI エージェント（実行層） CPU がどれだけ高速でも、OS が適切に管理しなければアプリケーションは動きません。同様に、LLM がどれだけ賢くても、ハーネスの設計が悪ければエージェントの出力品質は上がりません。コンテキストエンジニアリングとの関係 Andrej Karpathy が X で提唱した「コンテキストエンジニアリング」は、ハーネスエンジニアリングの中核概念です。 Context engineering is the delicate art and science of filling the context window with just the right information for the next step. — Andrej Karpathy LLM のコンテキストウィンドウを「RAM」と捉え、次のステップに必要な最適な情報だけを入れる技術です。ハーネスエンジニアリングはこのコンテキスト管理の仕組み全体を包む上位概念にあたります。ハーネスエンジニアリング（全体設計） ├── コンテキストエンジニアリング（何を LLM に渡すか） ├── 権限制御（何を許可・禁止するか） ├── ライフサイクル自動化（いつ何を実行するか） └── 並列実行・隔離（どう安全に並列化するか）「環境設計 > モデル能力」— OpenAI Codex チームの実証ハーネスエンジニアリングの重要性を最も説得力をもって示したのが、OpenAI のエンジニアリングチームによる 5 ヶ月間の実験です。 ...

ローカル LLM を金融取引の意思決定サポートに応用する — コードレビュー 4 段階カスタマイズの転用

ローカル LLM を金融取引の意思決定サポートに応用する — コードレビュー 4 段階カスタマイズの転用前回の記事では、ローカル LLM（Ollama + Qwen3）を社内コードレビューに特化させる 4 段階のカスタマイズ手法を紹介しました。この仕組みは金融取引の意思決定サポートにもそのまま応用できます。個人投資家が株式や BTC などの売買判断を行う際に、ニュース分析・テクニカル指標の解釈・リスク評価を自分の PC 上で、自分の投資ルールに基づいてAI に補助させる構成です。なぜローカル LLM が金融取引に向いているのか金融取引は、AI の活用にローカル環境が特に適している分野です。利点説明プライバシーポートフォリオ・売買履歴・資産額をクラウドに送信しないコスト毎日の市場分析やニュース要約を API 課金なしで実行可能カスタマイズ自分の投資スタイル・リスク許容度に完全に特化できる速度ネットワーク遅延がなく、市場の急変時にも即座に分析可能独立性 API 障害やサービス停止の影響を受けない 2024 年末時点で個人がビットコインの発行上限の約 69% を保有しており、個人投資家にとって自分だけの分析ツールを持つ意義はますます大きくなっています。コードレビューから金融取引への対応表前回の記事の 4 段階がどのように転用できるかを整理します。レベルコードレビュー金融取引サポート 1. Modelfile コーディング規約を教える売買ルール・リスク管理ルールを教える 2. RAG 障害報告・設計書を検索決算短信・ニュース・四季報を検索 3. Few-shot 過去のレビュー事例を見せる過去の売買判断の成功/失敗事例を見せる 4. LoRA PR レビュー履歴で再訓練金融センチメント分析データで再訓練レベル 1：投資ルールを「教える」 ← すぐできるレベル 2：市場情報を「渡す」 ← 1〜2日レベル 3：売買パターンを「見せる」 ← 数日レベル 4：金融の頭脳を「鍛える」 ← 1〜2週間レベル 1：Modelfile に投資ルールを埋め込む（即日導入）自分の投資ルール・リスク管理基準をシステムプロンプトとして設定します。 ...

ローカル LLM を社内業務に特化させる 4 段階カスタマイズ — Qwen3 を「より賢く」する仕組み

ローカル LLM を社内業務に特化させる 4 段階カスタマイズ — Qwen3 を「より賢く」する仕組み Claude Code で生成したコードをローカル LLM（Ollama + Qwen3）でレビューする構成を前回の記事で紹介しました。しかし、汎用モデルのままでは「受注ステータスの遷移ルール」や「金額計算に float を使ってはならない」といった社内固有のルールを知りません。この記事では、Qwen3 を社内業務に特化させ、特定のコーディング規約・業務ルール・過去の障害パターンを踏まえたレビューができるようにする 4 段階のカスタマイズ手法を紹介します。全体像：4 段階のカスタマイズレベル手法導入期間効果専門知識 1 Modelfile（システムプロンプト）即日ルールベースの指摘不要 2 RAG（社内ドキュメント検索） 1〜2 日文脈を踏まえた指摘 Docker の基本 3 Few-shot（レビュー事例の学習）数日パターン認識の向上不要 4 LoRA ファインチューニング 1〜2 週間モデル自体の精度向上 Python・ML の基本レベル 1：ルールを「教える」 ← すぐできるレベル 2：資料を「渡す」 ← 1〜2日レベル 3：お手本を「見せる」 ← 数日レベル 4：頭脳を「鍛える」 ← 1〜2週間推奨: レベル 1 から順に導入し、効果を確認しながらステップアップしてください。多くの場合、レベル 1 + 2 で十分な精度が得られます。 ...

.envの代わりにaws-vaultで安全に環境変数を与える — Claude Code時代のAWS認証情報管理

.env の代わりに aws-vault で安全に環境変数を与える — Claude Code 時代の AWS 認証情報管理 AI エージェントがローカルファイルを直接読み書きする時代、.env に平文で認証情報を置くリスクが顕在化しています。前回の記事では、この問題の背景と複数のシークレット管理ツールを紹介しました。本記事では、AWS を利用しているチームに向けて、aws-vault を使って .env と ~/.aws/credentials を完全に排除する具体的な手順を解説します。 aws-vault が解決する問題 ~/.aws/credentials の平文問題 AWS CLI を使う開発者の多くは、~/.aws/credentials にアクセスキーを平文で保存しています。 1 2 3 4 # ~/.aws/credentials（平文で保存されている） [default] aws_access_key_id = AKIAIOSFODNN7EXAMPLE aws_secret_access_key = wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY このファイルには2つのリスクがあります。 Claude Code が読み取れる: AI エージェントがファイルシステムを探索する際、~/.aws/credentials のアクセスキーが LLM のコンテキストに載る可能性がある長期的な認証情報が漏洩する: アクセスキーには有効期限がなく、漏洩した場合は手動でローテーションするまで悪用され続ける aws-vault のアプローチ aws-vault は以下の2段階で問題を解決します。暗号化保存: アクセスキーを ~/.aws/credentials ではなく、OS のキーストア（macOS Keychain 等）に暗号化して保存する一時認証の生成: AWS STS（Security Token Service）を使って、1時間で失効する一時認証情報を生成し、子プロセスに注入する [従来] ~/.aws/credentials（平文） → AWS CLI / boto3 が直接読み取り → 長期キーがメモリに残る [aws-vault] macOS Keychain（暗号化） → aws-vault が STS で一時認証を生成 → 子プロセスに環境変数として注入 → 1時間で失効セットアップインストール 1 2 3 4 5 6 7 8 9 10 11 12 13 # macOS（推奨） brew install --cask aws-vault # macOS（Homebrew formula 版） brew install aws-vault # Linux brew install aws-vault # Windows choco install aws-vault # または scoop install aws-vault macOS では --cask 版が推奨されています。コード署名されているため、Keychain アクセス時の追加のパスワードプロンプトが少なくなります。 ...

.envの代わりにlkrでLLM APIキーを安全に管理する — セットアップからClaude Code連携まで

.env の代わりに lkr で LLM API キーを安全に管理する — セットアップから Claude Code 連携まで AI エージェントがローカルファイルを読み書きする時代、.env に平文で置いた API キーが LLM のコンテキストに載るリスクが現実のものになっています。前回の記事ではこの問題の全体像を、aws-vault の記事では AWS 認証情報の保護を解説しました。本記事では、LLM Key Ring（lkr）を使って LLM API キーを安全に管理する具体的な手順を解説します。aws-vault が AWS 認証情報に特化しているのに対し、lkr は OpenAI・Anthropic・Google など LLM API キーの管理に特化したツールです。 lkr が解決する問題 .env に LLM API キーを置くリスク多くの開発者は .env ファイルに API キーを平文で保存しています。 1 2 3 # .env（平文で保存されている） OPENAI_API_KEY=sk-proj-xxxxxxxxxxxxxxxxxxxx ANTHROPIC_API_KEY=sk-ant-xxxxxxxxxxxxxxxxxxxx このファイルには4つの攻撃ベクトルがあります。攻撃ベクトル説明 Git への混入 .gitignore に頼るヒューマンエラー。うっかりコミットは後を絶たないシェル履歴への漏洩 export OPENAI_API_KEY=sk-... が ~/.bash_history に残るプロセス情報への露出 ps コマンドで環境変数が見える AI エージェントによる抽出 Claude Code がファイルを読み取り、LLM の API リクエストに含まれる 4番目が AI 時代に特有の脅威です。Claude Code は.env ファイルを自動的に読み込むことが確認されており、API キーが意図せず Anthropic のサーバーに送信されるリスクがあります。 ...

AI の名前に刻まれた「情報理論の父」--- Claude Shannon が LLM の数学的基盤を作った

AI の名前に刻まれた「情報理論の父」— Claude Shannon が LLM の数学的基盤を作った @finalvent 氏が X で投稿した、Anthropic の AI「Claude」の名前の由来に関するポストが注目を集めています。 Claudeって、Claude Shannonに因んでるのか。知らなかった。この一見シンプルな気づきは、現代の AI 技術と 78 年前の数学理論をつなぐ深い糸を浮かび上がらせます。Anthropic がなぜ自社の AI に「Claude」と名付けたのか — その理由を理解するには、Claude Elwood Shannon（1916-2001）が何を成し遂げたのかを知る必要があります。 Claude Shannon とは誰か「情報の時代」を切り拓いた数学者 Claude Elwood Shannon は、1916 年 4 月 30 日、アメリカ・ミシガン州ペトスキーに生まれました。ミシガン大学で数学と電気工学の二重学位を取得した後、MIT の修士課程で書いた論文が、すでに歴史的な業績でした。 1937 年の修士論文 — 「A Symbolic Analysis of Relay and Switching Circuits」— は、ブール代数（真/偽の論理演算）を電気回路のスイッチに対応させるという発想を初めて体系化しました。この論文により、複雑な論理をスイッチの ON/OFF の組み合わせで実現できることが数学的に証明され、デジタルコンピュータの設計基盤が確立されました。この修士論文は「20 世紀で最も重要な修士論文」と呼ばれることがあります。私たちが毎日使うスマートフォン、PC、サーバー — すべてのデジタル機器は、Shannon が 21 歳で示した原理の上に成り立っています。ベル研究所と MIT Shannon は 1941 年から 1972 年までベル研究所（Bell Labs）に在籍しました。当時のベル研究所は、トランジスタの発明（1947 年）、UNIX オペレーティングシステム、C 言語など、現代のコンピューティングの基盤技術を次々に生み出した「イノベーションの殿堂」です。 ...

dotenvx・lkr・aws-vault・1Password CLI — .env 代替ツール4種の選び方とベストプラクティス

dotenvx・lkr・aws-vault・1Password CLI — .env 代替ツール4種の選び方とベストプラクティス AI エージェントが .env ファイルを読み取るリスクが現実のものとなり、平文の .env を代替するツールが続々と登場しています。本シリーズでは aws-vault、lkr、dotenvx + 1Password CLI をそれぞれ解説してきました。しかし「結局どれを使えばいいのか」という疑問が残ります。本記事では、4つのツールの守備範囲・強み・限界を比較し、チーム構成や開発環境に応じた選択指針を提示します。 4ツールの守備範囲最も重要な違いは管理対象の範囲です。ツール管理対象 DB接続 SaaS キー LLM API キー AWS 認証 aws-vault AWS 認証情報のみ - - - 対応 lkr LLM API キー（8社） - - 対応 - dotenvx .env に書ける全て対応対応対応対応 1Password CLI 全種類対応対応対応対応 aws-vault と lkr は特定領域に特化したツールです。.env に含まれる全てのシークレットをカバーするには、dotenvx か 1Password CLI が必要になります。各ツールの強みと弱み aws-vault 1 $ aws-vault exec dev -- python manage.py runserver 強み弱み STS 一時認証（15分〜で自動失効） AWS 認証情報しか管理できない AssumeRole による権限分離 macOS 限定（Keychain 依存） MFA 統合チーム共有不可漏洩しても短時間で無効化される最大の強みは STS による一時認証です。他のどのツールも「漏洩しても自動で失効する」認証情報は提供できません。aws-vault が発行する一時認証情報は、仮に AI エージェントに読まれても最短15分で失効します。 ...