<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Oss on hdknr blog</title><link>https://hdknr.github.io/blogs/tags/oss/</link><description>Recent content in Oss on hdknr blog</description><generator>Hugo -- 0.157.0</generator><language>ja</language><lastBuildDate>Wed, 29 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://hdknr.github.io/blogs/tags/oss/index.xml" rel="self" type="application/rss+xml"/><item><title>Microsoft VibeVoice 徹底解説 — 60分の文字起こしと長尺音声合成をローカル無料で（OSS音声AI）</title><link>https://hdknr.github.io/blogs/posts/2026/04/microsoft-vibevoice-%E5%BE%B9%E5%BA%95%E8%A7%A3%E8%AA%AC-60%E5%88%86%E3%81%AE%E6%96%87%E5%AD%97%E8%B5%B7%E3%81%93%E3%81%97%E3%81%A8%E9%95%B7%E5%B0%BA%E9%9F%B3%E5%A3%B0%E5%90%88%E6%88%90%E3%82%92%E3%83%AD%E3%83%BC%E3%82%AB%E3%83%AB%E7%84%A1%E6%96%99%E3%81%A7oss%E9%9F%B3%E5%A3%B0ai/</link><pubDate>Wed, 29 Apr 2026 00:00:00 +0000</pubDate><guid>https://hdknr.github.io/blogs/posts/2026/04/microsoft-vibevoice-%E5%BE%B9%E5%BA%95%E8%A7%A3%E8%AA%AC-60%E5%88%86%E3%81%AE%E6%96%87%E5%AD%97%E8%B5%B7%E3%81%93%E3%81%97%E3%81%A8%E9%95%B7%E5%B0%BA%E9%9F%B3%E5%A3%B0%E5%90%88%E6%88%90%E3%82%92%E3%83%AD%E3%83%BC%E3%82%AB%E3%83%AB%E7%84%A1%E6%96%99%E3%81%A7oss%E9%9F%B3%E5%A3%B0ai/</guid><description>&lt;p&gt;VibeVoice は、60 分の長尺 ASR（音声認識）と 90 分のマルチ話者 TTS（音声合成）をローカル無料で実現する Microsoft 製の OSS 音声 AI。本記事では特徴・モデル構成・TTS コード削除の経緯を解説する。&lt;/p&gt;
&lt;p&gt;&lt;a href="https://github.com/microsoft/VibeVoice"&gt;microsoft/VibeVoice&lt;/a&gt; は GitHub スター数 &lt;strong&gt;45,000 超&lt;/strong&gt;（2026-04-29 時点）。ICLR 2026 に Oral 採択されたペーパーも公開されており、ASR・TTS の両領域で「フロンティア級」と呼べる性能を、軽量モデルで提供している。一方で、後述のとおり利用可能性については&lt;strong&gt;重要な注意点&lt;/strong&gt;がある。&lt;/p&gt;
&lt;h2 id="vibevoice-とは何か"&gt;VibeVoice とは何か&lt;/h2&gt;
&lt;p&gt;VibeVoice は、TTS と ASR を統合した「音声 AI モデルファミリー」として Microsoft Research が公開している OSS。中核のイノベーションは、&lt;strong&gt;7.5 Hz という超低フレームレートで動作する連続音声トークナイザー&lt;/strong&gt;（Acoustic + Semantic）を用いて、長尺音声の処理効率と忠実度を両立した点にある。&lt;/p&gt;
&lt;p&gt;LLM（Qwen2.5 1.5B ベース）が文脈・対話の流れを理解し、Diffusion ヘッドで高品質な音響細部を生成する &lt;strong&gt;next-token diffusion&lt;/strong&gt; フレームワークを採用している。&lt;/p&gt;
&lt;h2 id="モデルラインナップ"&gt;モデルラインナップ&lt;/h2&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;モデル&lt;/th&gt;
&lt;th&gt;パラメータ&lt;/th&gt;
&lt;th&gt;用途&lt;/th&gt;
&lt;th&gt;状態&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;VibeVoice-ASR-7B&lt;/td&gt;
&lt;td&gt;7B&lt;/td&gt;
&lt;td&gt;60分対応の話者識別付き音声認識&lt;/td&gt;
&lt;td&gt;✅ 利用可能&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;VibeVoice-TTS-1.5B&lt;/td&gt;
&lt;td&gt;1.5B&lt;/td&gt;
&lt;td&gt;90分・最大4話者の長尺TTS&lt;/td&gt;
&lt;td&gt;⚠️ コード削除済み&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;VibeVoice-Realtime-0.5B&lt;/td&gt;
&lt;td&gt;0.5B&lt;/td&gt;
&lt;td&gt;約300ms の低遅延ストリーミングTTS&lt;/td&gt;
&lt;td&gt;✅ 利用可能&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="1-vibevoice-asr--60分の長尺音声認識文字起こし"&gt;1. VibeVoice-ASR — 60分の長尺音声認識（文字起こし）&lt;/h3&gt;
&lt;p&gt;従来の ASR は音声を短いチャンクに分割するため、長尺になると話者識別や文脈の一貫性が失われやすい。VibeVoice-ASR は &lt;strong&gt;64K トークン長で最大 60 分の連続音声を 1 パスで処理&lt;/strong&gt;できる。&lt;/p&gt;</description></item><item><title>VibeVoice</title><link>https://hdknr.github.io/blogs/wiki/tools/vibevoice/</link><pubDate>Wed, 29 Apr 2026 00:00:00 +0000</pubDate><guid>https://hdknr.github.io/blogs/wiki/tools/vibevoice/</guid><description>Microsoft が公開する OSS の音声 AI ファミリー（ASR・TTS・リアルタイム TTS）</description></item><item><title>Claude Harness</title><link>https://hdknr.github.io/blogs/wiki/tools/claude-harness/</link><pubDate>Mon, 27 Apr 2026 00:00:00 +0000</pubDate><guid>https://hdknr.github.io/blogs/wiki/tools/claude-harness/</guid><description>Claude Code の拡張機構（hooks / permissions / skills / MCP）をワンパッケージで組み込んだ外装プラグイン。v4.0.0 &amp;#34;Hokage&amp;#34; で Go ネイティブ化・harness.toml 1 本管理を実現</description></item><item><title>Open Notebook</title><link>https://hdknr.github.io/blogs/wiki/tools/open-notebook/</link><pubDate>Wed, 22 Apr 2026 00:00:00 +0000</pubDate><guid>https://hdknr.github.io/blogs/wiki/tools/open-notebook/</guid><description>Google NotebookLM のオープンソース代替。プライバシー重視のローカル運用も可能</description></item><item><title>Claude Harness v4.0.0 "Hokage" — Go ネイティブ化で 30 倍速、設定が harness.toml 1 本に</title><link>https://hdknr.github.io/blogs/posts/2026/04/claude-harness-v4.0.0-hokage-go-%E3%83%8D%E3%82%A4%E3%83%86%E3%82%A3%E3%83%96%E5%8C%96%E3%81%A7-30-%E5%80%8D%E9%80%9F%E8%A8%AD%E5%AE%9A%E3%81%8C-harness.toml-1-%E6%9C%AC%E3%81%AB/</link><pubDate>Tue, 14 Apr 2026 00:00:00 +0000</pubDate><guid>https://hdknr.github.io/blogs/posts/2026/04/claude-harness-v4.0.0-hokage-go-%E3%83%8D%E3%82%A4%E3%83%86%E3%82%A3%E3%83%96%E5%8C%96%E3%81%A7-30-%E5%80%8D%E9%80%9F%E8%A8%AD%E5%AE%9A%E3%81%8C-harness.toml-1-%E6%9C%AC%E3%81%AB/</guid><description>&lt;p&gt;Claude Code の拡張 OSS「Claude Harness」が v4.0.0 &amp;ldquo;Hokage&amp;rdquo; をリリースした。コア全体を Go ネイティブに書き換え、フック実行速度が約 30 倍に向上。設定ファイルも &lt;code&gt;harness.toml&lt;/code&gt; 1 本に集約され、大幅に扱いやすくなった。&lt;/p&gt;
&lt;h2 id="claude-code-の拡張機構とは"&gt;Claude Code の拡張機構とは&lt;/h2&gt;
&lt;p&gt;Claude Code には最初から強力な拡張機構が備わっている。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;hooks&lt;/strong&gt; — &lt;code&gt;PreToolUse&lt;/code&gt; / &lt;code&gt;PostToolUse&lt;/code&gt; / &lt;code&gt;SessionStart&lt;/code&gt; などのイベントでスクリプトを差し込める&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;permissions&lt;/strong&gt; — &lt;code&gt;settings.json&lt;/code&gt; の deny ルールで危険なコマンドを事前ブロックできる&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;plugin system&lt;/strong&gt; — &lt;code&gt;plugin.json&lt;/code&gt; で自作プラグインを作り、チーム配布できる&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;skills&lt;/strong&gt; — スラッシュコマンドで自作ワークフローを走らせられる&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;MCP&lt;/strong&gt; — 外部ツール（DB・Slack・GitHub…）をネイティブ連携できる&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;「AI がやらかしそうなこと」「自律運用のワークフロー」「危ないコマンドのブロック」はほぼ全部、Claude Code の機能で実現できる。&lt;/p&gt;
&lt;h2 id="自分で全部セッティングするのは無理ゲー"&gt;自分で全部セッティングするのは無理ゲー&lt;/h2&gt;
&lt;p&gt;強力だからといって、簡単ではない。&lt;br&gt;
自作で「AI に危ないコマンドを通させない」ワークフローを組もうとすると、以下を理解しておかなければならない。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;plugin.json&lt;/code&gt; — プラグインマニフェスト&lt;/li&gt;
&lt;li&gt;&lt;code&gt;hooks.json&lt;/code&gt; — PreToolUse に走らせるスクリプトを宣言&lt;/li&gt;
&lt;li&gt;&lt;code&gt;settings.json&lt;/code&gt; — deny ルールを人力で組み立てる&lt;/li&gt;
&lt;li&gt;&lt;code&gt;.mcp.json&lt;/code&gt; — MCP サーバー設定&lt;/li&gt;
&lt;li&gt;&lt;code&gt;.claude-plugin/hooks.json&lt;/code&gt; — プラグイン経由のフックも別途&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;整合させる JSON が 5〜6 本。どれか 1 つを直すと別がズレる。&lt;br&gt;
さらに「Plan → Work → Review の自律運用」を乗せようとすると以下も必要になる。&lt;/p&gt;</description></item><item><title>Paperclip オープンソース化：0人会社を動かすエージェントオーケストレーション層</title><link>https://hdknr.github.io/blogs/posts/2026/03/paperclip-%E3%82%AA%E3%83%BC%E3%83%97%E3%83%B3%E3%82%BD%E3%83%BC%E3%82%B9%E5%8C%960%E4%BA%BA%E4%BC%9A%E7%A4%BE%E3%82%92%E5%8B%95%E3%81%8B%E3%81%99%E3%82%A8%E3%83%BC%E3%82%B8%E3%82%A7%E3%83%B3%E3%83%88%E3%82%AA%E3%83%BC%E3%82%B1%E3%82%B9%E3%83%88%E3%83%AC%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E5%B1%A4/</link><pubDate>Tue, 17 Mar 2026 00:00:00 +0000</pubDate><guid>https://hdknr.github.io/blogs/posts/2026/03/paperclip-%E3%82%AA%E3%83%BC%E3%83%97%E3%83%B3%E3%82%BD%E3%83%BC%E3%82%B9%E5%8C%960%E4%BA%BA%E4%BC%9A%E7%A4%BE%E3%82%92%E5%8B%95%E3%81%8B%E3%81%99%E3%82%A8%E3%83%BC%E3%82%B8%E3%82%A7%E3%83%B3%E3%83%88%E3%82%AA%E3%83%BC%E3%82%B1%E3%82%B9%E3%83%88%E3%83%AC%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E5%B1%A4/</guid><description>&lt;p&gt;AIエージェントを使った「0人会社（zero-human company）」のコンセプトが現実に近づいている。
&lt;a href="https://github.com/paperclipai/paperclip"&gt;Paperclip&lt;/a&gt; は、そのためのオーケストレーション基盤としてオープンソース化されたツールだ。&lt;/p&gt;
&lt;h2 id="paperclip-とは"&gt;Paperclip とは&lt;/h2&gt;
&lt;p&gt;Paperclip は「ゼロヒューマン企業」を動かすためのオーケストレーション層（orchestration layer）。
人間なしで自律的に業務が進む組織を設計・運用するための基盤として設計されている。&lt;/p&gt;
&lt;p&gt;GitHubリポジトリ: &lt;a href="https://github.com/paperclipai/paperclip"&gt;paperclipai/paperclip&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;リリース後またたく間にスターが集まり、2026年3月時点で &lt;strong&gt;53,000スター超&lt;/strong&gt; を記録している。&lt;/p&gt;
&lt;h2 id="主な機能"&gt;主な機能&lt;/h2&gt;
&lt;p&gt;Paperclip が提供する機能は次の通り:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;組織図（Org Charts）&lt;/strong&gt; — エージェントの役割と階層を定義する&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;目標整合（Goal Alignment）&lt;/strong&gt; — 組織全体の目標を各エージェントのタスクに紐付ける&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;タスクの責任者（Task Ownership）&lt;/strong&gt; — どのエージェントが何を担うかを明確に割り当てる&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;予算管理（Budgets）&lt;/strong&gt; — エージェントが使用できるリソースや費用に上限を設定する&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;エージェントテンプレート（Agent Templates）&lt;/strong&gt; — 役割ごとの標準的なエージェント設定を再利用する&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これらの仕組みにより、人間のオペレーターが常時介在しなくても「自律的に仕事が進む会社」を実現できる。&lt;/p&gt;
&lt;h2 id="クイックスタート"&gt;クイックスタート&lt;/h2&gt;
&lt;p&gt;セットアップは &lt;code&gt;npx&lt;/code&gt; で1コマンド:&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;
&lt;table style="border-spacing:0;padding:0;margin:0;border:0;"&gt;&lt;tr&gt;&lt;td style="vertical-align:top;padding:0;margin:0;border:0;"&gt;
&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code&gt;&lt;span style="white-space:pre;-webkit-user-select:none;user-select:none;margin-right:0.4em;padding:0 0.4em 0 0.4em;color:#7f7f7f"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td style="vertical-align:top;padding:0;margin:0;border:0;;width:100%"&gt;
&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;npx paperclipai onboard
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;このコマンドを実行すると、初期の組織設計のガイドが始まる。TypeScript 製で、Node.js 環境があればすぐに試せる。&lt;/p&gt;
&lt;h2 id="なぜ注目されるのか"&gt;なぜ注目されるのか&lt;/h2&gt;
&lt;p&gt;従来の AI エージェントフレームワークの多くは、単一エージェントまたは単純なマルチエージェントの連携を想定している。Paperclip が異なるのは、&lt;strong&gt;企業・組織レベルの構造&lt;/strong&gt;をファーストクラスの概念として扱っている点だ。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;単なるタスクキューではなく、&lt;strong&gt;組織図と権限委譲&lt;/strong&gt;を持つ&lt;/li&gt;
&lt;li&gt;エージェント同士の目標が&lt;strong&gt;整合されている&lt;/strong&gt;ことを保証する仕組みがある&lt;/li&gt;
&lt;li&gt;予算制約により&lt;strong&gt;無限ループや暴走&lt;/strong&gt;を防ぐ設計になっている&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;「AIエージェントに会社を任せる」という考えを本格的にサポートするインフラとして、エンジニアコミュニティの注目を集めている。&lt;/p&gt;
&lt;h2 id="参考リンク"&gt;参考リンク&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="https://github.com/paperclipai/paperclip"&gt;paperclipai/paperclip - GitHub&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://x.com/dotta/status/2029239759428780116"&gt;オープンソース化を告知したツイート（@dotta）&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description></item></channel></rss>