Qwen | hdknr blog

Ollama で Qwen3 を動かす初心者ガイド — 日本語最強ローカルLLMを自分のPCで使う方法

Ollama で Qwen3 を動かす初心者ガイド — 日本語最強ローカル LLM を自分の PC で使う方法「ChatGPT みたいな AI を、自分の PC だけで動かせたら」と思ったことはありませんか。Ollama と Qwen3 を使えば、それが実現できます。この記事では、Saiteki AI の解説記事をベースに、初心者でもわかるように Ollama と Qwen3 の導入手順をまとめました。まず知っておきたい：LLM・ランタイム・エージェントの 3 層構造 AI の世界には、混同しやすい 3 つの概念があります。この記事で扱う Ollama と Qwen がどこに位置するかを最初に整理しましょう。レストランに例えるとお客さん（あなた） ↓ 「パスタを作って」ウェイター（AI エージェント） ← 注文を聞き、判断し、段取りを組む ↓ 「この食材でこう調理して」キッチン設備（ランタイム） ← オーブンや鍋。料理を物理的に実行する環境 ↓ シェフの腕＝レシピの知識（LLM） ← 実際に「どう調理するか」を知っている頭脳層役割具体例自分で判断するか LLM（AI モデル）言葉を理解し、回答を生成する「頭脳」 Qwen3, Llama3, Gemma2 しない（聞かれたことに答えるだけ）ランタイム LLM をメモリに読み込み、動かす「実行環境」 Ollama, vLLM, llama.cpp しない（言われた通り動かすだけ） AI エージェント LLM を使って自律的に「仕事」をこなすプログラム Claude Code, Devin, Dify する（目標に向かって複数ステップを自分で組み立てる） 3 つの関係 AI エージェント（Claude Code など） ↓ 「この質問を LLM に投げて」ランタイム（Ollama など） ↓ モデルをメモリに読み込んで推論実行 LLM（Qwen3 など） ↓ 回答を生成ランタイム → エージェントに結果を返す LLM は「頭脳」。質問されたら答えを返すが、自分からは何もしないランタイムは「エンジン」。LLM を動かすが、何を質問するかは決めないエージェントは「ドライバー」。ランタイム経由で LLM を呼び出し、結果を見て次の行動を自分で決めるこの記事で扱うのは、LLM（Qwen3）とランタイム（Ollama）の 2 つです。エージェントは含みませんが、Ollama で動かした Qwen3 を Claude Code や Dify などのエージェントのバックエンドとして使うことも可能です。 ...

QwenVoice --- Mac でボイスクローニング・感情表現・音声デザインを完全オフラインで実現する Qwen3-TTS アプリ

QwenVoice — Mac でボイスクローニング・感情表現・音声デザインを完全オフラインで実現する Qwen3-TTS アプリ @ai_hakase_ 氏が X で紹介した、Mac 向け音声生成アプリ「QwenVoice」が注目を集めています。【Mac で革命】Qwen3-TTS 搭載の最強音声生成アプリ「QwenVoice」。ボイスクローニングや感情表現が Mac で爆速！Apple Silicon 最適化でオフライン動作も完璧です。面倒な設定なしでプロ級のナレーションを生成可能。 QwenVoice は、Alibaba Cloud の Qwen チームが開発したオープンソース TTS モデル「Qwen3-TTS」を Apple Silicon Mac でネイティブに動かす GUI アプリです。Python のインストールもターミナル操作も不要で、ドラッグ & ドロップだけで使い始められます。本記事では、QwenVoice の機能と Qwen3-TTS の技術的な仕組みを解説します。 QwenVoice の概要何ができるのか QwenVoice は 3 つの音声生成モードを提供します。モード機能使い方 Custom Voice プリセット音声で読み上げ 4 種類の英語話者（Ryan, Aiden, Serena, Vivian）から選択 Voice Design 自然言語で新しい声を作る「落ち着いた男性の低い声」のようにテキストで指示 Voice Cloning 既存の声を複製 5〜10 秒の音声サンプルから声を再現 3 つのモードすべてが 100% オフラインで動作します。音声データがクラウドに送信されることはありません。システム要件要件スペック OS macOS 14.0（Sonoma）以上プロセッサ Apple Silicon（M1 / M2 / M3 / M4）メモリ 8 GB 以上推奨インストール手順 1 2 3 4 5 # 1. GitHub Releases から QwenVoice.dmg をダウンロード # 2. /Applications にドラッグ # 3. 検疫属性を解除（署名なしのため） xattr -cr "/Applications/QwenVoice.app" # 4. アプリを起動 → Models タブ → モデルをダウンロード → 生成開始 Python 環境の構築やライブラリのインストールはアプリが自動で行います。ユーザーが触るのは GUI だけです。 ...

ローカル LLM を金融取引の意思決定サポートに応用する — コードレビュー 4 段階カスタマイズの転用

ローカル LLM を金融取引の意思決定サポートに応用する — コードレビュー 4 段階カスタマイズの転用前回の記事では、ローカル LLM（Ollama + Qwen3）を社内コードレビューに特化させる 4 段階のカスタマイズ手法を紹介しました。この仕組みは金融取引の意思決定サポートにもそのまま応用できます。個人投資家が株式や BTC などの売買判断を行う際に、ニュース分析・テクニカル指標の解釈・リスク評価を自分の PC 上で、自分の投資ルールに基づいてAI に補助させる構成です。なぜローカル LLM が金融取引に向いているのか金融取引は、AI の活用にローカル環境が特に適している分野です。利点説明プライバシーポートフォリオ・売買履歴・資産額をクラウドに送信しないコスト毎日の市場分析やニュース要約を API 課金なしで実行可能カスタマイズ自分の投資スタイル・リスク許容度に完全に特化できる速度ネットワーク遅延がなく、市場の急変時にも即座に分析可能独立性 API 障害やサービス停止の影響を受けない 2024 年末時点で個人がビットコインの発行上限の約 69% を保有しており、個人投資家にとって自分だけの分析ツールを持つ意義はますます大きくなっています。コードレビューから金融取引への対応表前回の記事の 4 段階がどのように転用できるかを整理します。レベルコードレビュー金融取引サポート 1. Modelfile コーディング規約を教える売買ルール・リスク管理ルールを教える 2. RAG 障害報告・設計書を検索決算短信・ニュース・四季報を検索 3. Few-shot 過去のレビュー事例を見せる過去の売買判断の成功/失敗事例を見せる 4. LoRA PR レビュー履歴で再訓練金融センチメント分析データで再訓練レベル 1：投資ルールを「教える」 ← すぐできるレベル 2：市場情報を「渡す」 ← 1〜2日レベル 3：売買パターンを「見せる」 ← 数日レベル 4：金融の頭脳を「鍛える」 ← 1〜2週間レベル 1：Modelfile に投資ルールを埋め込む（即日導入）自分の投資ルール・リスク管理基準をシステムプロンプトとして設定します。 ...

ローカル LLM を社内業務に特化させる 4 段階カスタマイズ — Qwen3 を「より賢く」する仕組み

ローカル LLM を社内業務に特化させる 4 段階カスタマイズ — Qwen3 を「より賢く」する仕組み Claude Code で生成したコードをローカル LLM（Ollama + Qwen3）でレビューする構成を前回の記事で紹介しました。しかし、汎用モデルのままでは「受注ステータスの遷移ルール」や「金額計算に float を使ってはならない」といった社内固有のルールを知りません。この記事では、Qwen3 を社内業務に特化させ、特定のコーディング規約・業務ルール・過去の障害パターンを踏まえたレビューができるようにする 4 段階のカスタマイズ手法を紹介します。全体像：4 段階のカスタマイズレベル手法導入期間効果専門知識 1 Modelfile（システムプロンプト）即日ルールベースの指摘不要 2 RAG（社内ドキュメント検索） 1〜2 日文脈を踏まえた指摘 Docker の基本 3 Few-shot（レビュー事例の学習）数日パターン認識の向上不要 4 LoRA ファインチューニング 1〜2 週間モデル自体の精度向上 Python・ML の基本レベル 1：ルールを「教える」 ← すぐできるレベル 2：資料を「渡す」 ← 1〜2日レベル 3：お手本を「見せる」 ← 数日レベル 4：頭脳を「鍛える」 ← 1〜2週間推奨: レベル 1 から順に導入し、効果を確認しながらステップアップしてください。多くの場合、レベル 1 + 2 で十分な精度が得られます。 ...

Claude Code に「目」を与える --- ローカル VLM で画像・動画をコンテキスト消費ゼロで理解させる

Claude Code に「目」を与える — ローカル VLM で画像・動画をコンテキスト消費ゼロで理解させる @ShadeLurk 氏が X で公開した記事が注目を集めています。 Claude Code に「目」を作る — コンテキストを 1 トークンも使わずに動画を理解させる方法 Claude Code で画像や動画を扱うと、1 枚あたり数千トークンがコンテキストから消えます。ローカル VLM（Qwen3-VL 等）を MCP サーバー経由で接続し、画像処理をオフロードすることで、Claude Code のコンテキストを一切消費せずにビジュアル情報を扱う手法が提案されています。本記事では、この問題の構造と解決アプローチを技術的に解説します。問題 — 画像 1 枚で数千トークンが消える Claude のビジョン処理とトークン消費 Claude API でのビジョン処理は、画像をトークンに変換してコンテキストウィンドウに載せる仕組みです。Anthropic の公式ドキュメントによると、トークン消費量は以下の式で算出されます。 tokens = (width px × height px) / 750 画像サイズトークン数 1,000 枚あたりのコスト 200x200 px（0.04 MP）約 54 約 $0.16 1000x1000 px（1 MP）約 1,334 約 $4.00 1092x1092 px（1.19 MP）約 1,590 約 $4.80 1 枚の高解像度スクリーンショットで約 1,600 トークンが消費されます。Claude Code のコンテキストウィンドウは約 200,000 トークンですが、システムプロンプト・CLAUDE.md・会話履歴・MCP ツール定義などが既に占有しているため、実質的に使える容量は限られています。 ...

個人のファインチューニング済みモデルを P2P で相互利用する --- 分散 MoE で「みんなの AI」は成立するか

個人のファインチューニング済みモデルを P2P で相互利用する — 分散 MoE で「みんなの AI」は成立するか先の記事「オープンソース AI は『無料』でも『民主化』でもない」で取り上げた Dario Amodei の指摘 — 推論には高価な計算資源が必要であり、重みの公開だけでは真の民主化にならない — に対して、興味深い反論の構想があります。 Qwen 3.5 のような軽量モデルを各個人が自分のドメインでファインチューニングし、P2P ネットワークで互いのエージェントに相互利用させれば、大規模 LLM と同等の仕組みを分散的に構築できるのではないか? この構想を技術的に検証します。構想の全体像 — 分散 Mixture of Experts この発想は、商用 LLM の内部で使われている Mixture of Experts（MoE）アーキテクチャを、P2P ネットワーク上に展開したものと捉えることができます。個人A: Qwen 3.5 (法律ドメインでファインチューニング) 個人B: Qwen 3.5 (医療ドメインでファインチューニング) 個人C: Qwen 3.5 (プログラミング特化) 個人D: Qwen 3.5 (会計・税務特化) 個人E: Qwen 3.5 (マーケティング特化) ↓ P2P ルーティングレイヤー（質問の性質に応じて最適なノードを選択） ↓ エージェントが複数の専門モデルを横断的に活用商用 LLM が「1 つの巨大なモデル内でエキスパートを切り替える」のに対し、この構想は「ネットワーク上の独立した専門モデルを切り替える」アプローチです。なぜ今この構想が現実味を帯びているのか 3 つの技術的な進歩が、この構想を「空想」から「検討に値する」レベルに引き上げています。 ...

Second Me — AI に「自分の分身」を持つ時代と OpenClaw との本質的な違い

Second Me — AI に「自分の分身」を持つ時代と OpenClaw との本質的な違い前回の記事で OpenClaw による 13 体 AI チーム構築を紹介しました。OpenClaw では SOUL.md というファイルでエージェントの「人格」を定義しますが、これは本当に「自分の分身」と呼べるのでしょうか。Second Me というプロジェクトは、まったく異なるアプローチで「AI による自分の分身」を実現しようとしています。 SOUL.md の限界 — 「指示書」は「分身」ではない OpenClaw の SOUL.md は Markdown で書かれた設定ファイルです。エージェントの名前、性格、役割、制約を自然言語で記述します。 1 2 3 4 5 6 7 8 9 10 --- name: sales-agent model: claude-sonnet-4-6 --- あなたは営業チームの一員です。丁寧に話してください。 ## 役割 - リード情報の整理と優先順位付け - 提案メールの下書き作成これは強力な仕組みですが、あくまで外から与える指示書です。「営業エージェントをこう振る舞わせたい」という設計者の意図を反映したものであり、「この人ならどう考えるか」を再現するものではありません。 ...