記事一覧 | hdknr blog

OpenDataLoader PDF — CPUだけで毎秒100ページ、PDFをMarkdownに超高速変換するOSSツール

GPUなしで毎秒100ページ以上のPDF→Markdown変換を実現するオープンソースツール「OpenDataLoader PDF」が話題になっている。Apache 2.0ライセンスで完全無料、CPUのみで動作するため、高価なGPUハードウェアは不要だ。 OpenDataLoader PDF とは OpenDataLoader PDF は、PDFドキュメントをAI活用に適した構造化データ（Markdown、JSON、HTML等）に変換するオープンソースのパーサーだ。Java で実装されており、Python・Node.js・Java から利用できる。主な特徴: 超高速処理: ローカルモードで 0.05秒/ページ（CPUのみ）、8コア以上のマシンでマルチプロセスバッチ処理すると毎秒100ページ以上 GPU不要: CPUだけで高速に動作するため、導入コストが低い高精度: ベンチマークで総合精度0.90を達成し、読み順・テーブル・見出し抽出で1位 Apache 2.0ライセンス: 商用利用可能な完全オープンソースインストール Python パッケージは Java CLI のラッパーのため、Java 11以上とPython 3.10以上が必要だ。 1 2 3 4 5 # Python pip install -U opendataloader-pdf # Node.js npm install @opendataloader/pdf Java の場合は Maven で opendataloader-pdf-core を依存関係に追加する。基本的な使い方 Python でのシンプルな変換 1 2 3 4 5 6 7 import opendataloader_pdf opendataloader_pdf.convert( input_path=["file1.pdf", "file2.pdf", "folder/"], output_dir="output/", format="markdown,json" ) フォルダを指定すれば一括変換も可能だ。出力形式は Markdown、JSON、HTML、プレーンテキスト、注釈付きPDFから選べる。 ...

Palo Alto Cortex XDR の振る舞い検知ルールが解読・バイパスされた脆弱性の全容

Palo Alto Networks の EDR（Endpoint Detection and Response: エンドポイント検知・対応）製品「Cortex XDR」のエージェントに、重大な欠陥が発見された。振る舞い検知（BIOC: Behavioral Indicators of Compromise）ルールを解読し、検知を完全に回避できるというものだ。InfoGuard Labs の研究者 Manuel Feifel らが発見し、2025年7月に報告、2026年2月末に修正がリリースされた。Cortex XDR エージェント v8.7/8.8 を利用する組織は、修正済みの v9.1 へのアップデートが必要となる。発見の経緯 InfoGuard Labs の研究チームは、Cortex XDR Windows エージェント（バージョン 8.7 および 8.8）の内部構造を調査した。カーネルデバッグツールを使用してエージェント内部の暗号化ルールの復号プロセスを追跡し、以下を特定した。復号キーがエージェントのファイル内にハードコードされた文字列から導出されていた平文の Lua 設定ファイルと組み合わせてキーが生成されていた暗号化には AES-256-CBC が使用されていたが、全環境で同一の鍵が導出されるため、一度手法を解明すれば任意の環境で再現可能だったグローバル許可リストの問題復号された BIOC ルールを解析した結果、検知ロジックにハードコードされた「グローバル許可リスト」の存在が明らかになった。特に深刻だったのは \Windows\ccmcache という文字列の扱いだ。プロセスのコマンドラインにこの文字列が含まれるだけで、そのプロセスは監視対象から除外される仕組みになっていた。この条件により、BIOC ルール全体の約半数の振る舞い検知ルールを無効化できることが確認された。 ccmcache は Microsoft SCCM（System Center Configuration Manager）がソフトウェア配布時に使用するキャッシュディレクトリだ。正規のシステム管理ツールによるプロセスを誤検知しないための除外条件だったと考えられるが、その適用範囲が過度に広範だった。実証された攻撃シナリオ研究者は Sysinternals の ProcDump ツールに \Windows\ccmcache 文字列を引数として付加し、LSASS（Local Security Authority Subsystem Service）メモリのダンプ取得を無検知で実行できることを実証した。 LSASS メモリダンプは認証情報窃取の典型的な手法であり、Mimikatz などのツールによるクレデンシャルハーベスティング（認証情報の大量収集）に直結する。EDR がこの操作を検知できないことは、実運用環境において極めて深刻な影響をもたらす。 ...

Vibe Coding で結果を出すために必要な2つのスキル — CS基礎知識と論理的文章力

Vibe Coding（バイブコーディング）で成果を出せる人と出せない人の違いは何か。CHI 2026 で発表された論文「Computer Science Achievement and Writing Skills Predict Vibe Coding Proficiency」が、その答えを実証的に示している。結論は、CS の基礎知識と論理的な文章作成能力の2つが鍵だというものだ。 Vibe Coding とは Vibe Coding は、2025年初頭に Andrej Karpathy が提唱したプログラミングスタイルだ。ソースコードを直接編集するのではなく、自然言語で LLM にプログラムの仕様を伝える。生成された結果を観察しながら反復的に改善していくアプローチだ。「誰でも自然言語でアプリが作れる時代」と言われる一方で、実際には同じツールを使っても成果に大きな差が出る。この差を生む要因は何なのか。論文の概要 Sverrir Thorgeirsson、Theo B. Weidmann、Zhendong Su の3名による研究（arXiv: 2603.14133）は、大学生100名を対象にした事前登録済み（仮説や分析計画を事前に公開した）横断研究だ。被験者は以下の4つの能力を測定された: コンピュータサイエンス（CS）の達成度汎用的な認知能力（いわゆる「頭の良さ」）文章作成能力 Vibe Coding の成績（専門家の合意で設計された評価タスク）評価タスクでは、参加者はまずサンプルアプリケーションを確認する。次に LLM ベースのエージェントへプロンプトを作成し、生成されたアプリケーションをテストしながら改善を重ねる。最終的な成果物を人間の評価者が採点した。 2つの重要な予測因子研究の結果、Vibe Coding の成績を有意に予測する因子は以下の2つだった: 1. CS の基礎知識（最も重要） CS の達成度は、汎用的な認知能力を統制した後でも有意な予測因子として残った。つまり、「頭が良い」だけでは不十分で、コンピュータサイエンスの基礎を理解していることが独立した強みになる。回帰分析の結果、CS の知識が説明する固有分散（ΔR² = 0.125）は文章力（ΔR² = 0.059）の約2倍だった。 2. 論理的な文章作成能力文章を論理的に構成し、意図を明確に伝える能力も有意な予測因子だった。これは当然とも言える。LLM に的確な指示を出すには、要件を整理し、曖昧さなく文章化するスキルが求められるからだ。「頭の良さ」だけでは足りない興味深いのは、汎用的な認知能力（特定分野に依存しない一般的な認知スキル）は、それほど大きな影響を持たなかったという点だ。これは重要な示唆を含んでいる。Vibe Coding は「誰でもできる」わけではないが、「天才でなければできない」わけでもない。CS の基礎知識と論理的な文章力という、学習可能なスキルが鍵を握っている。教育・実務への示唆この研究結果は、AI 時代のプログラミング教育に対して重要な問いを投げかける: ...

Zapier を使った HubSpot と Asana の連携：集計ロジックも追加する方法

Zapier を使って HubSpot と Asana を連携させる方法と、Code by Zapier で集計ロジックを追加するテクニックを紹介します。 HubSpot × Asana 連携の基本 HubSpot（CRM・マーケティング）と Asana（プロジェクト管理）を連携させることで、営業パイプラインとタスク管理を自動化できます。Zapier を使えばノーコードで連携を構築できます。よくある連携パターントリガー（HubSpot）アクション（Asana）ユースケース新規ディールが作成されたタスクを作成商談ごとにプロジェクトタスクを自動生成ディールのステージが変わったタスクを更新進捗をリアルタイムに反映フォーム送信があったタスクを作成問い合わせ対応タスクを自動起票新規チケットが作成されたタスクを作成サポート対応を Asana で管理逆方向の連携もあります。トリガー（Asana）アクション（HubSpot）ユースケースタスクが完了したコンタクトを更新納品完了を CRM に反映タスクにコメントが追加されたエンゲージメントを作成活動履歴を CRM に記録 Zapier での連携セットアップ 1. Zap の作成 Zapier にログインし、「Create Zap」から新しい Zap を作成します。トリガーの設定（例: HubSpot → Asana）: トリガーアプリに HubSpot を選択トリガーイベントに「New Deal」を選択 HubSpot アカウントを接続テストを実行して動作確認アクションの設定: ...

ジオマーケティングとは？位置情報を活用した集客手法と FreakOut ASE の特徴

ジオマーケティング（Geo-marketing）は、スマートフォンの GPS やWi-Fi、ビーコンなどから取得した位置情報を活用して、特定エリアのユーザーに最適な広告や情報を配信するマーケティング手法です。ここでは、ジオマーケティングの基本と、FreakOut 社が提供する位置情報マーケティングプラットフォーム「ASE」を紹介します。ジオマーケティングの基本ジオマーケティングとは、ユーザーの位置情報データを分析・活用して、地域に根差した集客やプロモーションを行う手法です。取得できるデータ来訪者の属性: どこから来ているか、年代、単身か家族連れか行動パターン: 何曜日の何時に人が集まるか商圏分析: 周辺エリアの人流データ主なデータソース GPS（スマートフォン） Wi-Fi 接続情報ビーコン（Bluetooth） IP アドレス FreakOut ASE — 位置情報マーケティングプラットフォーム FreakOut ASE は、フリークアウト社が提供する位置情報マーケティングプラットフォームです。主な特徴項目内容リーチ規模 5,000万以上のユーザーエリア精度最小半径1m の円指定、ポリゴン指定に対応配信面 Red ネットワーク、TVer PMP、各種 SNS 来店計測建物に沿った精密な来店計測分析機能推定居住エリア、ユーザー行動分析データソースチェーンストアデータ NTT iタウンページゼンリン社の住居データ提携した大手スマートフォンアプリベンダーや位置情報データプラットフォーマーから位置情報を取得し、国内最大規模の位置情報データベースを構築しています。活用シーンジオマーケティングは、実店舗を持つビジネスとの相性が良く、以下のような活用が可能です。チラシ・OOH の補完ショッピングモールへの来場促進新店舗オープンの告知ターゲティング広告大学オープンキャンパスの告知（周辺エリアの高校生向け）自動車ディーラーへの来店促進住宅展示場への誘導学習塾の受講者募集流通対策家電量販店での販売促進ドラッグストア来店者への医薬品告知国内主要サービス比較 — ASE / AIR TRACK / GeoLogic Ad FreakOut ASE 以外にも、国内にはジオターゲティング広告の主要プラットフォームがあります。ここでは代表的な 2 サービスと機能を比較します。 ...

デザイナーのためのAI活用術5選 — 制作スピードを劇的に上げる実践テクニック

デザイナーの仕事が AI で「本当にすぐ終わる」時代が来ている。21歳でデザイン会社を経営するコンドウハルキ氏が X で共有した AI 活用術が大きな反響を呼んでいる。本記事では、同氏が紹介した 5 つの実践的な AI 活用ユースケースを掘り下げる。 1. Claude Code × Figma で制作スピードを大幅に高速化最も注目すべきユースケースが Claude Code と Figma の連携だ。チャットで指示するだけで、編集可能なデザインファイルが生成される。従来は数時間かかっていたランディングページの制作が、わずか数分で完成するという。ポイントは「完成品を作る」のではなく「たたき台を一瞬で作り、そこから人間が磨く」という使い方にある。 2. AI モックアップで制作前の事前検証本制作に入る前に、AI でモックアップやデザインバリエーションを素早く作成し、クライアントに方向性を確認する手法。事前にバリエーションを見せることで「思っていたのと違う」という手戻りを大幅に減らせる。Autodesk の調査では、AI ツールの活用によりデザイン修正時間が約40%削減されたというデータもある。 3. AI 画像生成で素材検索の時間をゼロにストックフォトサイトで「ちょうどいい画像」を探す作業は、意外と時間がかかる。30分以上かけて検索した挙句、微妙な妥協をした経験は誰にでもあるだろう。 AI 画像生成を使えば、必要なイメージをテキストで指示するだけでカスタム素材が生成できる。検索時間がゼロになるだけでなく、案件ごとにオリジナルの素材が使える点も大きい。 4. セールスコピーの作成支援技術的なスキルは高いのに、デザインの価値を言葉で伝えるのが苦手 — そんなデザイナーは少なくない。 AI を使えば、デザインのコンセプトや効果を的確に言語化できる。提案書のコピーライティングやクライアントへの説明文など、「言葉にする」作業を AI がサポートしてくれる。 5. AI が24時間対応のデザインメンターに余白のバランス、タイポグラフィの比率、ビジュアルヒエラルキー — デザインのフィードバックが欲しいとき、AI が 24時間対応のメンターとして機能する。特に一人で仕事をしているフリーランスデザイナーにとって、いつでも客観的なフィードバックが得られる環境は心強い。 AI 活用の成否を分けるポイントコンドウ氏が強調するのは、「何を AI に任せ、何を人間がやるか」の判断力が成否を分けるという点だ。 AI はあくまでツールであり、デザインの本質的な価値 — ユーザーの課題を理解し、最適な体験を設計すること — は人間の仕事のままだ。AI で効率化した時間を、より本質的な思考やクライアントとのコミュニケーションに充てることで、結果的により高い価値を提供できる。 ...

人間の脳細胞で動く「データセンター」— Cortical Labs の生体コンピューティング革命

オーストラリアのスタートアップ Cortical Labs が、人間の脳細胞（ニューロン）をシリコンチップ上に培養し、それを演算装置として利用する「生体データセンター」の構想を発表しました。1 台あたりの消費電力は電卓以下とされ、従来の GPU ベースの AI インフラとはまったく異なるアプローチで、エネルギー問題への解決策として注目されています。 CL1 — 生体コンピュータユニット Cortical Labs が開発した CL1 は、ヒト血液幹細胞から培養した約 20 万個のニューロンをマイクロ電極アレイ（MEA）チップ上に配置した生体コンピュータです。主な特徴: 電気信号によるソフトウェア連携: MEA チップを通じてニューロンに電気信号を送信し、その応答をリアルタイムで記録・処理する超低消費電力: 1 台の CL1 の消費電力は電卓以下。GPU クラスタと比較して桁違いに省エネルギー長寿命: ニューロンは通常 6 か月以上生存し、最長 1 年の維持実績がある学習能力: 少量のデータセットから学習可能で、構造化された電気フィードバックにより適応的に活動パターンを変化させる DishBrain — Pong から DOOM へ CL1 の基盤となった研究が DishBrain プロジェクトです。 2022 年: 学術誌「Neuron」に論文発表。約 80 万個の培養ニューロンが Pong ゲームをプレイすることに成功 2026 年 2 月: より複雑な 3D ゲーム「DOOM」のプレイに成功。生体ニューロンの情報処理能力の向上を実証 2022 年の Pong 成功以降、ニューロンの制御精度と情報処理能力の改善を重ね、4 年で単純な 2D ゲームから複雑な 3D 環境への対応を実現しました。 ...

燈（Akari Inc.）の建設業向け管理業務DXサービス「Digital Billder」

東大松尾研発の AI スタートアップ「燈株式会社（Akari Inc.）」が提供する、建設業に完全特化した管理業務 DX サービス「Digital Billder（デジタルビルダー）」を紹介します。 Digital Billder とは Digital Billder は、建設業の管理業務をデジタル化するための SaaS サービスです。紙ベースで行われていた請求書処理、発注管理、経費精算といったアナログ業務を効率化します。建設業界では、紙の請求書の受領・開封・現場ごとの整理・現場と本社間の運搬・押印・手入力といった煩雑な作業が日常的に発生しています。Digital Billder はこれらの業務を電子化し、大幅な工数削減を実現します。サービスラインナップ Digital Billder は以下の4つのサービスで構成されています。請求書処理（Digital Billder Invoice）建設業特有の業務フローに対応した請求書処理サービスです。工事ごと・工種ごとの請求書管理出来高払い・査定・相殺処理への対応各社の指定書式に柔軟に対応インボイス制度・電子帳簿保存法に準拠発注管理（Digital Billder Purchases）電子発注・電子契約に対応した発注管理サービスです。見積依頼から発注・契約までの一連のフローをデジタル化します。経費精算（Digital Billder Expenses）建設現場で発生する経費の精算を効率化するサービスです。現場経費と一般経費の両方に対応しています。見積書処理見積書の作成・管理をデジタル化し、業務プロセスを効率化します。提供会社：燈株式会社（Akari Inc.）燈株式会社は2021年2月に設立された、東京大学松尾研究室発の AI スタートアップです。代表取締役 CEO: 野呂侑希所在地: 東京都文京区小石川従業員数: 約300名企業評価額: 1,000億円超（2026年1月時点） 2026年1月には三菱電機などから50億円の資金調達を実施し、ユニコーン企業の仲間入りを果たしました。建設業特化の生成 AI「光/Hikari」の開発や、大成建設・東洋建設といった大手ゼネコンとの DX 推進プロジェクトも手がけています。導入実績 2022年6月に一般提供を開始リリース1年で導入総合建設業者100社を突破 2025年11月時点で累計導入企業数1,000社超 36都道府県以上で導入建設業界の DX 背景建設業界では以下の法制度対応が求められており、DX の必要性が高まっています。インボイス制度（2023年10月〜）改正電子帳簿保存法（2024年1月〜）時間外労働上限規制（2024年4月〜、いわゆる「2024年問題」）こうした制度対応と業務効率化を同時に実現できる点が、Digital Billder が急速に普及している理由の一つです。 ...

1Password Unified Access：AIエージェント時代のシークレット管理が本格始動

Claude Code や Cursor で開発していると、.env に書いた API キーを AI が普通にファイルシステムから読みに行く。.gitignore していても関係ない。この課題に対して、1Password が Anthropic・Cursor・GitHub・Vercel・Perplexity と連携し「AI エージェント時代のシークレット管理」を本気で構築し始めた。何が発表されたのか 2026年3月17日、1Password は 1Password Unified Access を発表した。人間・マシン・AI エージェントにまたがるアクセスを一元的に発見・保護・監査するためのプラットフォームだ。従来のパスワードマネージャーの枠を超え、AI エージェントが本番環境で実際に動作する時代に合わせたクレデンシャル管理を提供する。なぜ必要なのか：.env 問題 AI コーディングツール（Claude Code、Cursor など）は、タスク遂行のためにローカルファイルシステム上のファイルを読む。.env ファイルに平文で保存された API キーやトークンは、AI エージェントから直接アクセスできてしまう。 .gitignore はリポジトリへのコミットを防ぐだけで、ローカルファイルシステム上での読み取りは防げない。つまり、現状の .env ベースのシークレット管理は AI エージェント時代には不十分だ。各社との連携内容 Anthropic（Claude Code / Cowork / ブラウザ拡張） Anthropic は 1Password を統合し、Claude Code、Cowork、Claude ブラウザ拡張からボールト内のアイテムを安全にオートフィルできるようにする。ユーザーの同意のもと、Claude がサイトやサービスに 1Password から直接クレデンシャルを取得してログインできる仕組みだ。 Cursor（Hooks による just-in-time シークレット） Cursor との連携では、Cursor Hooks を活用した just-in-time なシークレット提供を実現する。仕組みは以下の通り: プロジェクトに hooks.json を設定 Cursor がシェルコマンドを実行する前に、1Password Environments Hook Script が起動プロセスがアクセスを要求すると、1Password がユーザーに認証を求める承認されると、必要なシークレットがランタイムセッションのメモリ上にのみ提供されるこれにより、平文キーがディスクやソースコードにコミットされることがなく、環境変数のハードコードやトークンの履歴残留も防げる。 ...

redis-py の Lock をサブクラス化してフェンシングトークンを実装する

redis-py の Lock クラスは UUID ベースのトークンでロックの所有権を管理するが、フェンシングトークン（単調増加する数値）は提供しない。しかし、Lock クラスは do_acquire や Lua スクリプトをオーバーライドできる設計になっており、サブクラス化でフェンシングトークンを追加できる。本記事では、redis-py の Lock を拡張してフェンシングトークンを発行する FencedLock クラスの実装例を紹介する。前提知識：Redis の Lua スクリプティング Redis はバージョン 2.6 から Lua スクリプトの実行機能を内蔵している。EVAL コマンドで Lua スクリプトを Redis サーバー上で直接実行でき、複数の Redis コマンドをアトミック（不可分）に実行できる。なぜ Lua スクリプトが必要か通常、Redis コマンドは1つずつ実行される。例えば「キーが存在しなければセットし、同時にカウンターをインクリメントする」という処理を2つのコマンドで行うと、その間に他のクライアントが割り込む可能性がある：クライアント A: SET mykey value NX → 成功 ← クライアント B が割り込む余地クライアント A: INCR counter → インクリメント Lua スクリプトを使えば、この2つの操作を1回のアトミックな呼び出しにまとめられる： 1 2 3 4 5 6 -- Redis サーバー上で実行される（他のコマンドは割り込めない） local ok = redis.call('SET', KEYS[1], ARGV[1], 'NX') if ok then return redis.call('INCR', KEYS[2]) end return nil Redis CLI での実行例 1 2 # EVAL "スクリプト" キーの数キー1 キー2 ... 引数1 引数2 ... redis-cli EVAL "return redis.call('SET', KEYS[1], ARGV[1])" 1 mykey myvalue redis-py での実行例 1 2 3 4 5 6 7 8 9 10 import redis r = redis.Redis() # 方法1: eval で直接実行 r.eval("return redis.call('SET', KEYS[1], ARGV[1])", 1, "mykey", "myvalue") # 方法2: register_script で事前登録（推奨） # サーバー側に SHA1 でキャッシュされ、2回目以降はスクリプト本文の転送が不要 script = r.register_script("return redis.call('GET', KEYS[1])") result = script(keys=["mykey"]) セキュリティ上の注意 Lua スクリプトのパラメータは KEYS[] と ARGV[] で渡される。SQL のプリペアドステートメントと同様に、パラメータが文字列としてスクリプトに展開されることはないため、パラメータ経由でのインジェクションはできない。ただし、ユーザー入力でスクリプト文字列自体を動的に組み立てると危険なので、スクリプトは固定文字列として定義すること。 ...