Ollama

OpenHuman — 完全ローカルで動くパーソナルAIアシスタント：プライバシー最優先でChatGPT級の体験を自分のPCで

2026-05-27 追記: 実際にインストールしてみたところ、デフォルトのままでは TinyHumans へのサブスク課金（=有料アカウント）が必要なことが判明した。GPL-3 のオープンソースなのになぜ有料なのか、本記事に「なぜ TinyHumans への課金が必要なのか」セクションを追加した。「完全ローカル」を額面どおりに実現するための回避ルートも併記している。「クラウドAIに自分の悩みを打ち明けるのが不安」という声をよく聞く。仕事の機密、家族の話、健康上の悩み——ChatGPTに投げてはみるものの、その会話がサーバーに残り続けることへの抵抗感は根強い。そこに登場したのが OpenHuman だ。GitHubスター数2.7万を超え、週に1,000以上のペースで増え続けるこのプロジェクトは、「ChatGPT級のAIを完全にローカルで動かす」という問いへの実践的な回答を提供している。 OpenHumanとは OpenHuman は、TinyHumans AIが開発するオープンソースのエージェント型AIアシスタントだ。Rustをコアに持ち、デスクトップアプリとして動作する。公式の説明は簡潔にまとめられている。 Your Personal AI super intelligence. Private, Simple and extremely powerful. ポイントは3点だ。 Memory Tree による長期記憶 Obsidianスタイルのローカルナレッジベース 118以上のサービス連携これらを組み合わせることで、「インストールから数分でユーザーを知り尽くしたエージェント」を目指している。なぜ「ローカルAI」が重要なのか ChatGPTをはじめとするクラウドAIの課題は、会話が外部サーバーへ送信される点にある。個人情報保護の観点から問題となるだけでなく、企業での利用では情報漏洩リスクが伴う。 OpenHumanが解決しようとしているのはこの点だ。会話を外に出さない構成が選べる — ローカルLLM（Ollama / LM Studio経由）を選択すれば推論まで自機で完結するデータは自分のPCに保存される — Memory Tree DB と Markdown Vault はローカルファイルとして残る日本語README完備 — 日本語ユーザーへの配慮も行き届いている Rust製で爆速 — コアがRustで書かれており、動作が軽快ただし注意点がある。デフォルト構成では「サインイン」「モデルルーティング」「Web検索プロキシ」「Composio経由のOAuth/ツール連携」がすべてOpenHuman（TinyHumans）社のマネージドバックエンドを経由する。つまり初回起動時に TinyHumans アカウントを作って有料サブスクに入らないと、せっかくのMemory TreeもAuto-fetchも動かない。「完全オフライン」を額面どおりに実現するには、ローカルモデル＋Composio直接モード＋自前のWeb検索APIキー、といった追加設定が必要になる。詳細は後述する。主な機能 Memory Tree + Obsidian Vault OpenHumanの中核機能は Memory Tree だ。接続した各種サービスから取得したデータを3,000トークン以内のMarkdownチャンクに圧縮し、SQLiteに階層的に保存する。同時に、Obsidianと互換性のある .md ファイルとしてローカルVaultへ書き出す。 ...

macOS キャッシュ掃除チートシート — 開発マシンの数百 GB を取り戻す

開発マシンを放置していると、パッケージマネージャやコンテナ、IDE のキャッシュが気づかないうちに数百 GB に膨れ上がります。本記事では、主要なツールごとにキャッシュを安全に削除するコマンドをまとめます。パッケージマネージャ系 Python 環境の uv は特に溜まりやすく、100 GB を超えることもあります。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 # uv (Python) — 100 GB+ 溜まることも uv cache clean # npm npm cache clean --force # pnpm pnpm store prune # Yarn yarn cache clean # pip pip cache purge # Poetry — `poetry cache list` でキャッシュ名を確認してから個別削除も可能 # 下記の "." は全キャッシュソースを対象にする引数（Poetry バージョンによっては要確認） poetry cache clear --all . # Homebrew — ダウンロード済みアーカイブ brew cleanup --prune=all コンテナ・仮想化 Docker は数百 GB になりがちです。OrbStack / Docker Desktop どちらでも同じコマンドが使えます。 ...

Hermes Agent — Telegram × AI で個人専属エージェントを構築、使うほど成長する「資産型 AI」

Hermes Agent は Nous Research が開発した自己進化型 AI エージェントで、Telegram・Discord・Slack から操作でき、使うほどユーザー固有のスキルとメモリが蓄積される。本記事ではインストールから Telegram ゲートウェイ設定、OpenClaw からの移行手順まで解説する。 Hermes Agent とは NousResearch/hermes-agent（GitHub 13.7万⭐）は、Nous Research が開発した自己進化型 AI エージェントだ。キャッチフレーズは「The agent that grows with you」— 使うほど自分専用に成長していく。 OpenClaw ユーザーからの移行を想定した hermes claw migrate コマンドが用意されており、設定・メモリ・スキル・API キーを丸ごとインポートできる。主な特徴使うほど成長する学習ループ Hermes の最大の特徴は、フィードバックが自分のデータ内で完結する閉じた学習ループにある。複雑なタスクをこなすたびにスキルを自動生成過去の会話を FTS5 全文検索 + LLM 要約でクロスセッション想起ユーザーを深く理解するモデルを会話ごとに更新自分が作ったスキルは /skills list --source local で一覧確認できる。スキルが積み上がっていく感覚が、個人専用のナレッジベース形成につながる。 Telegram ゲートウェイ Telegram 以外にも Discord・Slack・WhatsApp・Signal・Email に対応。VPS 上で 24 時間稼働させ、外出先からスマートフォンで操作するという使い方が現実的になっている。モデルを自由に切り替える /model コマンドで会話中でも即時切替できる。用途に応じた使い分けの例: 用途モデル例日常会話 Ollama Cloud（ほぼ無料）中程度の開発作業 Sonnet 複雑なタスク Claude Code / Codex 対応プロバイダーは Nous Portal・OpenRouter（200+ モデル）・NVIDIA NIM・OpenAI・Hugging Face など多数。コードを変更せずプロバイダーを切り替えられる。 ...

Open-notebook — NotebookLM をセルフホストできる完全ローカル OSS

Google の NotebookLM に触発されたオープンソース実装 open-notebook が海外のテック界隈で注目を集めている。データを一切外部に送信しない完全ローカル動作を売りに、Docker で約2分で立ち上げられる手軽さも人気の理由だ。 open-notebook とは open-notebook は、NotebookLM の主要機能をすべて再実装した OSS プロジェクト。2024年10月に公開され、2026年4月時点で 22,000 スター超を獲得している。公式サイト: open-notebook.ai 主な機能マルチソースの知識統合 PDF・動画・音声・ウェブページを横断で読み込ませ、AI とのチャット形式で対話できる。NotebookLM と同様の使い勝手を、完全ローカル環境で実現する。多数の AI バックエンドに対応 OpenAI・Anthropic（Claude）・Google Gemini・Ollama・Mistral・Groq・xAI・Deepseek など主要なプロバイダーを幅広くサポートしている。バックエンド備考 Anthropic (Claude) クラウド OpenAI (GPT) クラウド Google Gemini クラウド Ollama ローカル・完全無料 Mistral / Groq / xAI / Deepseek などクラウド Ollama を選択すれば、外部サービスへの通信がゼロのオフライン環境でも完全無料で運用できる。ポッドキャスト風音声の生成複数の話者でポッドキャスト形式の音声を自動生成できる。NotebookLM が2人固定なのに対し、open-notebook は話者数をカスタマイズ可能な点が差別化ポイント。 REST API 完備 REST API が標準搭載されているため、企業内アプリへの組み込みや外部サービスとの連携が容易。n8n や LangChain などのワークフローツールからも呼び出せる。日本語 UI 対応インターフェースが日本語に対応しており、日本のユーザーでもすぐに使い始められる。 ...

Gemma 4 31B vs Qwen3.5-27B — ローカルLLM最強はどちらか

2026年春、ローカルで動かせる高性能 LLM の選択肢が充実してきた。中でも注目なのが Google の Gemma 4 31B（2026年4月リリース、Apache 2.0）と Alibaba の Qwen3.5-27B（2026年2月リリース）だ。どちらも密（dense）モデルで、Apple Silicon Mac や RTX 4090 クラスの GPU で実用的に動作する。結論を先に述べると、推論・マルチモーダルなら Gemma 4、コーディング・メモリ効率なら Qwen3.5 が適している。本記事では、その判断根拠を主要な観点から比較する。基本スペック比較項目 Gemma 4 31B Qwen3.5-27B パラメータ数 31B 27B アーキテクチャ Dense Transformer（Hybrid Attention） Dense（Gated Delta Net + FFN）コンテキスト長 256K トークン 262K トークン（最大 1M 拡張可）対応言語 140+ 言語 201 言語マルチモーダルビジョン（画像理解・OCR）ビジョン（画像理解）ライセンス Apache 2.0 Apache 2.0 開発元 Google DeepMind Alibaba Qwen 両モデルとも Apache 2.0 ライセンスで、商用利用に制限がない。コンテキスト長はほぼ同等だが、Qwen3.5 は 1M トークンまでの拡張に対応している点で有利だ。 ...

OpenClaw + Ollama + Gemma4 でローカル無料AIエージェントを構築する

API課金なしで、ローカル環境にAIエージェントを無制限で運用できるセットアップ方法を紹介します。OpenClaw（エージェントインターフェース）+ Ollama（ローカルモデルサーバー）+ Gemma4（推論エンジン）の組み合わせにより、Telegram・Discord・LINEなどの既存チャンネルともシームレスに連携できます。構成概要コンポーネント役割 OpenClaw AIエージェントのインターフェース・オーケストレーション Ollama ローカルLLMサーバー（モデルの管理・API提供） Gemma4 推論エンジン（Google製オープンモデル）この3つを組み合わせることで、クラウドAPIへの依存なしにフル機能のAIエージェントが動作します。セットアップ手順 1. Ollama のインストール 1 2 3 4 5 # macOS / Linux curl -fsSL https://ollama.ai/install.sh | sh # Windows # https://ollama.ai からインストーラーをダウンロード 2. Gemma4 モデルの取得 1 ollama pull gemma4 3. OpenClaw のインストール 1 npm install -g openclaw 4. オンボーディングウィザードの実行 1 openclaw onboard ウィザードに従ってOllama接続設定とチャンネル連携（Telegram・Discord・LINEなど）を行います。 ...

claw-code-local — Claude Code風のAIコーディングエージェントをローカルLLMで動かす

Claude Code ライクなターミナル AI コーディングエージェントを、Anthropic API なしでローカル LLM で動かせる「claw-code-local」が登場しました。Rust で実装された軽量・高速なツールで、Ollama や LM Studio など好みの LLM バックエンドを自由に選べます。 claw-code-local とは claw-code-local は、Claude Code のアーキテクチャをクリーンルーム方式（既存コードを参照せず仕様から独自に再実装する手法）で作られた「Claw Code」のフォークです。ローカル LLM や任意の OpenAI 互換エンドポイントに接続できるよう拡張されています。オリジナルの Claw Code は Rust で書かれたマルチプロバイダー API レイヤーを持っていましたが、実際のバイナリにはその機能が組み込まれていませんでした。claw-code-local はこの部分を修正し、Ollama、LM Studio、OpenAI、xAI など様々なプロバイダーに接続できるようにしています。主な特徴ローカル LLM 対応: Ollama、LM Studio、その他 OpenAI 互換エンドポイントで動作 Rust 実装: 軽量・高速なバイナリマルチプラットフォーム: Windows、Linux、macOS に対応コストゼロ: ローカル LLM を使えば API 費用が不要プライバシー保護: コードが外部サーバーに送信されないため、機密情報の漏洩リスクを低減セットアップ手順 1. リポジトリのクローンとビルド 1 2 3 git clone https://github.com/codetwentyfive/claw-code-local.git cd claw-code-local/rust cargo build -p rusty-claude-cli --release ビルド後のバイナリは以下に生成されます: ...

Onyx（旧 Danswer）完全ガイド — 無料で使えるオープンソース AI プラットフォーム

Onyx（旧 Danswer）は、社内のドキュメント・アプリ・人材をまとめて繋ぎ、どんな LLM とも連携できるオープンソースの AI プラットフォームです。Community Edition（CE）は MIT ライセンスで完全無料。セルフホストできるため、データを外部に出さずに AI チャットや RAG、エージェント機能を利用できます。 Onyx とは Onyx は企業向け AI アシスタント＆検索プラットフォームです。Slack、GitHub、Confluence、Google Drive など 50 以上のコネクタで社内ナレッジを統合し、自然言語で質問するだけで必要な情報を引き出せます。 GitHub リポジトリ（onyx-dot-app/onyx）のスター数は 22,000 超で、活発に開発が続いています。主な機能チャット＆RAG ハイブリッド検索: ベクトル検索とキーワード検索を組み合わせた高精度な情報検索 Agentic RAG: AI エージェントが検索クエリの生成・評価・再検索を自律的に繰り返し、複数ステップで情報を収集 Deep Research: 多段階のリサーチフローで詳細なレポートを生成エージェント＆ツールカスタムエージェント: 固有の指示・知識・アクションを持つ AI エージェントを構築可能 Web 検索: リアルタイムの Web 情報を取得コード実行: サンドボックス内でコードを実行し、データ分析やグラフ描画が可能画像生成: プロンプトに基づいた画像生成音声モード: テキスト読み上げ＆音声入力に対応コネクタ（50 以上） Slack、GitHub、Confluence、Notion、Google Drive、Jira、Linear など主要サービスと連携。MCP（Model Context Protocol）経由のカスタムコネクタにも対応しています。エディション比較項目 Community Edition (CE) Enterprise Edition (EE) ライセンス MIT（無料）商用ライセンスチャット・RAG・エージェント ✅ ✅ SSO（OIDC / SAML） — ✅ エアギャップ環境 — ✅ サポートコミュニティ専用サポート Cloud 版も提供されており、セルフホストなしで試用できます。ビジネスプランは 1 ユーザーあたり月額 $16〜。 ...

Claude Code を Ollama でローカル無料実行する方法

Claude Code がローカル LLM で無料実行できるようになった。Ollama を使えば、API 料金なしで Claude Code のインターフェースを活用できる。背景 Claude Code は Anthropic が提供する CLI ベースの AI コーディングアシスタントだ。通常は Anthropic API を通じて利用するため、API 使用料が発生する。しかし Ollama v0.14.0 以降で Anthropic Messages API 互換のエンドポイントが実装され、ローカル LLM を Claude Code のバックエンドとして使えるようになった。 2026年1月にリリースされた Ollama v0.15 では ollama launch claude コマンドが追加され、セットアップがさらに簡単になっている。セットアップ手順方法1: ollama launch（推奨・v0.15 以降） Ollama v0.15 で追加された ollama launch コマンドを使えば、環境変数の設定なしでワンコマンドで起動できる: 1 ollama launch claude モデルを指定する場合: 1 ollama launch claude --model qwen3-coder 方法2: 環境変数を手動設定（v0.14 以降） 1. Ollama のインストール macOS/Linux の場合は以下のコマンドでインストールできる。macOS では公式サイトのインストーラーも利用可能: ...

Claude Code × ローカルLLM で KVキャッシュが毎回無効化される問題と対策

Claude Code をローカルLLM（llama.cpp、Ollama など）で使う際に、毎回プロンプト処理に異常な時間がかかるという問題が報告されています。原因は Claude Code が付加する「Attribution Header」によるKVキャッシュの無効化です。設定一つで解決できるので、対処法をまとめます。何が起きているのか Claude Code v2.1.36 以降、リクエストごとに以下のような Attribution Header がプロンプトの先頭に付加されるようになりました。 x-anthropic-billing-header: cc_version=xxxx; cc_entrypoint=cli; cch=xxxx; この cch の値がリクエストのたびに変化します。ローカルLLMサーバー（llama.cpp、Ollama、LM Studio など）はプロンプトの先頭からバイト単位で一致した部分までKVキャッシュを再利用する仕組みのため、先頭が毎回変わるとキャッシュが丸ごと無効化されます。結果として、数万トークンのシステムプロンプトや会話履歴を毎回ゼロから処理することになり、推論速度が最大90%低下するという報告があります。対策：Attribution Header を無効化する ~/.claude/settings.json の env セクションに以下を追加します。 1 2 3 4 5 { "env": { "CLAUDE_CODE_ATTRIBUTION_HEADER": "0" } } 既に settings.json がある場合は env セクション内にキーを追加してください。注意点 export CLAUDE_CODE_ATTRIBUTION_HEADER=0 ではダメ。シェルの環境変数として設定しても反映されません。必ず settings.json 経由で設定しますついでに不要なテレメトリも無効化しておくと、余計な通信を減らせます 1 2 3 4 5 6 7 { "env": { "CLAUDE_CODE_ATTRIBUTION_HEADER": "0", "CLAUDE_CODE_ENABLE_TELEMETRY": "0", "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1" } } KVキャッシュの仕組みをおさらいローカルLLMサーバーが採用している Prefix Caching（Automatic Prefix Caching）は、プロンプトの先頭から連続して一致するトークン列のKV（Key-Value）テンソルを再利用する仕組みです。 ...