〜 動画URLを貼るだけで完成する、8フェーズ全自動の手順書PDFの中身 〜
はじめに
操作手順書を、動画から手作業で起こしたことがある方なら分かるはずです。
再生して、止めて、スクリーンショットを撮って、文章にして、また再生して――この往復を、動画の最後まで繰り返す。
1本の手順書を作るだけで、半日が消えることも珍しくありません。
この「再生 → 一時停止 → スクショ → 文章化」のループを、まるごと自動化してしまおうというのが、今回ご紹介するスキルです。
やることは1つだけ。
動画の URL(または手元の動画ファイル)を渡す。
それだけで、
画面のスクリーンショットとその場面で何をしているかの解説文が
時系列のステップで並んだ マニュアル PDF
が、確認画面なしで一気通貫に出来上がります。
コードを書く必要はありません。
動画を指定して、出てきた PDF に目を通すだけです。
このスキルを、本文ではここから『動画まるごとマニュアル』と呼ばせてください。
Claude Code 上で動く、8フェーズ構成の全自動マニュアル生成スキルです。
動作環境について: このスキルは Claude Code(Anthropic の CLI ツール)が動く環境で使用します。
Claude Code をまだお使いでない方も大丈夫です。
本スキルには Claude Code インストールマニュアル(Mac / Windows 両対応) が同梱されているので、購入後にそのまま導入を進められます。
この記事は、無料エリアでスキルの全体像と価値・自作の壁・判断基準をお伝えし、有料エリアでスキル本体(zip)をお渡しする構成になっています。

このスキルが効くのは、こういう作業をしている方です
動画から操作手順書・マニュアルを作る作業を、定期的にやっている
研修動画やチュートリアルを、読み返せる資料の形で残しておきたい
溜まった動画を、見る時間が無くて消化できていない
動画の中身を、検索・引用・共有できるドキュメントに変えたい
業種は問いません。
動画を「見る」「手順書にする」作業が発生する人すべてに効きます。

先にひと言だけ:このスキルの真価について
このスキルの本質的な価値は「8フェーズのフロー設計」そのものではありません。
その中で動いている 「画面を読んで手順を書き起こす解説ロジック」と「読みやすい1枚のPDFに組み上げる後処理」 の作り込みにあります。
ここが本当に大変で、全工程の中で一番時間をかけて磨いた部分です。
詳しくは後半でお話しします。
このスキルが、代わりにやってくれること
『動画まるごとマニュアル』は、動画の URL(またはローカルの動画ファイル)を1つ渡すだけで、以下のすべてを確認画面なしで一気通貫に自動生成します。
マニュアル PDF:画面スクリーンショット+手順解説が、時系列のステップで並んだ文書
ステップ構成:動画の場面の切り替わりを検出し、意味のまとまりごとに自動でステップ分割
解説文(です・ます調):各場面で「何をしているか」を、画面のボタン名・メニュー名まで踏まえて記述
埋め込み画像:各ステップの代表画面を埋め込み。
Word が無くても・スマホでも必ず表示される
出力される PDF は、Word 不要・全 OS・スマートフォン・ブラウザのいずれでも開けます。
画像は PDF に直接埋め込まれるため、「相手の環境で画像が見られない」という事故が起きません。
納品やチーム共有を前提にした、素直に配れる文書形式です。
そして特筆すべきは「動画を見ずに、動画の中身が手に入る」という点です。
10分の動画でも2時間の動画でも、あなたが消費するのは「処理を待つ時間」だけ。
出来上がった PDF は、上から読めば数分で全体を把握でき、しかも検索できます。
上の画像は、実際にこのスキルで生成したマニュアル PDF の一部です。
約7分の操作解説動画を入力し、8ステップのスクリーンショット付き手順書として出力したものです。
使い始めると、こんな変化が起こります
このスキルを導入すると、動画との付き合い方が次のように変わります。
ツール1本でカバーできる範囲がかなり広いので、順に紹介します。

① 「動画を見る時間」が「PDFを読む数分」になる
これまで動画1本に費やしていた視聴時間が、ほぼ消えます。
処理は自動で進むので、あなたは待っているだけ。
出来上がった PDF は、上から流し読みすれば全体像が数分でつかめます。
「とりあえず再生して、ぼんやり眺める」という最も時間を浪費する見方から解放されます。
② 動画が「検索できる資産」に変わる
動画の弱点は、中身を検索できないことです。
マニュアル PDF にしてしまえば、文字として検索でき、必要な場面に一発でたどり着けます。
「あの操作どうやるんだっけ」のたびに動画をシークする時間が、まるごと無くなります。
③ 手順書づくりが「再生して待つだけ」になる
操作手順書を手で作ると、再生 → 一時停止 → スクショ → 文章化、の繰り返しになります。
この一番面倒な工程を、スキルが丸ごと引き受けます。
あなたがやるのは、動画を指定して、出てきた PDF に最終チェックを入れるだけです。
④ 動画コンテンツを「配れる文書」として再利用できる
セミナー動画やチュートリアルを、そのままでは渡しにくい場面は多いはずです。
PDF マニュアルにしておけば、メールにも添付でき、印刷もでき、相手は好きなタイミングで読めます。
1本の動画が、配布しやすい資料という別の形に変わります。
⑤ 「動画を見る/見ない」の判断が一瞬でできる
長い動画を「見る価値があるか」は、見終わるまで分かりません。
先にマニュアル PDF を生成しておけば、要点を数分で確認でき、「ここだけ動画で見直そう」「これは PDF で十分」という判断が即座にできます。
動画の取捨選択そのものが速くなります。

あらためて整理すると、手に入るものは
時間:動画の視聴時間がほぼゼロに。
処理は全自動で、人は待つだけ
品質:画面のボタン名・メニュー名まで踏まえた、です・ます調の手順解説
検索性:動画では不可能だった「中身の検索・引用」が PDF で可能になる
量産性:動画を渡すたびに動く。
1本で終わらず、たまった動画を順に片づけられる
挫折ゼロ:確認画面なしの全自動。
指定して待つだけなので、途中で止まらない
配布のしやすさ:Word 不要・全OS・スマホ可・画像埋め込み。
相手の環境を選ばない PDF
画像が必ず映る:スクショは PDF に直接埋め込み。
「画像が表示されない」事故を後処理で排除済み
文字化けの自動検査:出力後に文字化けを自動チェックする工程を内蔵。
崩れた文書をそのまま渡さない

末尾の2項目――「画像が必ず映る」と「文字化けの自動検査」――は地味ですが、人に渡す文書では事故になりやすいポイントです。
ここを後処理で潰してあることが、このスキルの実用度を支えています。
どうやって動いているのか(8フェーズの中身を、浅く広くお見せします)
「ブラックボックスのまま売られても困る」というのは正論なので、8フェーズの中で何が起きているかを、すべて概要レベルで開示します。
動かしている実装そのもの(解説ロジックやスクリプト)はスキル本体の中に組み込まれていて、配置すればこのフロー全体が自動で発火するようになっています。

Phase 1: 動画取得
YouTube の URL ならダウンロードし、ローカルの動画ファイルなら取り込みます。
動画が壊れていないか・長さや形式が処理できる範囲かを、ここで検証します。
Phase 2: 文字起こし
YouTube 動画は、まず字幕を直接取得する高速パスを試します。
これが通れば動画の長さに関係なく数秒で完了します。
字幕が無い動画やローカル動画は、音声認識(faster-whisper)に切り替えて文字起こしします。
「速い道があるなら速い道を、無ければ確実な道を」という二段構えです。
Phase 3: シーン検出
動画の中で「画面が切り替わったタイミング」を検出します。
操作が次の段階に進んだ境目を、ここで拾います。
Phase 4: チャンク正規化
文字起こしとシーンの境目を突き合わせ、15〜90秒の「意味のまとまり」に整えます。
細かすぎても粗すぎても読みにくいので、ステップとして気持ちよく読める長さに正規化します。
Phase 5: 代表フレーム抽出
各ステップから、その場面を一番よく表す画面を1枚切り出します。
マニュアルに載るスクリーンショットは、ここで決まります。
Phase 6: 重複削除
似たような画面が何枚も並ぶとマニュアルが冗長になります。
画像の類似度を計算して、ほぼ同じ場面はまとめます。
残った画像は、軽くて画質の良い形式に最適化します。
Phase 7: 解説生成
このスキルの心臓部です。
各ステップの画面を実際に読み取り、「この場面で何をしているか」を、です・ます調の解説文にします。
文字起こしを丸写しせず、画面で起きている操作を主語にして書くこと、口語のクセや動画と無関係な雑談を取り除くこと――この書き分けのルールが、ここに組み込まれています。
Phase 8: PDF 生成(完成)
解説文とスクリーンショットを1枚の文書に組み上げ、PDF に変換します。
最後に文字化けが起きていないかを自動で検査します。
最終出力は manual.pdf の1ファイルだけ。
あとはご自身で中身に目を通し、必要なら手直しして使うだけです。
ここから先――特に Phase 7 の「画面を読んで手順に書き起こす」部分――は、ルールの試行錯誤の塊です。
次の章で、その中身を正直にお話しします。
自作するか、買うか — 正直なところをお話しします
ここまで読んで、「自分でも作れそうだ」と思った方もいるはずです。
実際、上記のフロー全体像を理解していれば、技術的にゼロから組むこと自体は可能です。
この記事の中では、作り方のノウハウは全部お話しします。
やれる方はぜひ自作してみてください。
本当に勉強になります。
ただし、ここで一番正直に伝えたいことがあります。
解説生成(Phase 7)で、実際に何が起きるか
動画をマニュアル化すると、最初は次のようなことが毎回のように起きます。
文字起こしをそのまま貼り付けただけの、読めない解説になる
「えー」「あの」「なんか」といった口語が解説文に混じる
「チャンネル登録お願いします」のような、手順と無関係な雑談がステップとして残る
同じ画面のスクリーンショットが何枚も連続して並ぶ
スクショは入っているのに、相手の環境で画像が表示されない
これらを1つずつ潰していくために辿り着いた工夫を、隠さずお話しします。
解説文は「画面で起きている操作」を主語にして書く というルールを明文化 → 文字起こしの丸写しを防止
口語表現を除去し、です・ます調に統一する 指示を組み込み → 解説のトーンが安定
挨拶だけ・宣伝・締めの雑談は、固定の省略文に置き換える → 手順書に余計な行が残らない
画像の類似度を計算して重複をまとめる → 同じ画面の連続を排除
埋め込み画像を、どの環境でも表示される形式に変換する後処理 → 「画像が見えない」事故を根絶
出力後に文字化けを自動検査する工程 → 崩れた文書をそのまま世に出さない
このルール群に辿り着くまでに、何十回もの試し生成と微調整が必要でした。
1つ抜けると、すぐに「読めない解説」「雑談混じり」「画像が映らない」が再発します。
組版と後処理も一筋縄ではいかない
「スクショと解説を1枚の PDF にする」のは、簡単そうに見えて落とし穴が多い工程です。
たとえば日本語の文字化け1つ取っても、フォントの指定、画像形式の選び方、変換経路の組み方――これらを全部詰めないと、相手の環境で開いた瞬間に崩れます。
動画の長さによってステップ数は大きく変わるので、どんな分量でも破綻しない組版にする必要もあります。
この後処理を安定させるだけでも、相応の試行錯誤が必要でした。
つまり、自作はできます。ただし時間がかかります
ここまでの内容を頭に入れれば、技術的には自作できます。
ただ、こちらはこの解説ロジックと後処理の作り込みに、延べ数日〜数週間を使いました。
同じ完成度に辿り着くには、おそらく同じくらいの時間が必要です。
このスキルでは、時間をかけて辿り着いた完成形のロジックを、すべてスキル本体に組み込んだ状態でお渡しします。
配置すれば、その完成形がそのまま動きます。
「自分の本業や、本来やりたいことの方に時間を使いたい」という方は、買ってしまった方が合理的だと思います。
ルールの試行錯誤に数日〜数週間を使うか、その時間を本業に使うかの選択です。
逆に「試行錯誤こそ最高の学習」という方には、自作をおすすめします。
本当に勉強になります。
自作するか、買うかの判断基準
自作が向いている方:ルール開発・試行錯誤が好き、数日〜数週間の調整を楽しめる、学習目的。
購入が向いている方:本業・本来の作業に時間を使いたい、今日からマニュアル化を始めたい、とにかく動画の山を早く片づけたい。

このスキルをお渡しします
お渡しするのは『動画まるごとマニュアル』のスキル本体一式です。
Claude Code に配置していただくだけで、これまでお話ししてきた8フェーズすべてが動作します。
価格: 9,800円(税込)
特定の業種向けの高額ツールではなく、動画を扱うすべての方に気軽に使っていただける価格にしました。
スキル本体に組み込まれているロジック
8フェーズの自動進行(動画の指定 → PDF 完成までを確認なしで一気通貫)
画面を読み取って手順を書き起こす解説ロジック(操作主語・口語除去・雑談の省略処理)
場面の切り替わりを検出してステップに整えるチャンク設計(15〜90秒で正規化)
似た画面をまとめる重複削除と、画像の最適化
どの環境でも画像が表示される埋め込み処理と、文字化けの自動検査つき PDF 組版
同梱物
スキル本体(video-to-manual-ss:SKILL.md / スクリプト一式 / 共通ライブラリ)
YouTube セットアップ手順(YouTube 動画を扱う場合の初回設定)
Claude Code インストールマニュアル(未経験の方向け・Mac / Windows 両対応)
スキルを配置すれば、8フェーズのロジックはすべて内部で自動的に動きます。
プロンプトファイルや設定ファイルを個別に扱う必要はありません。

こんな方におすすめです
学びたい動画が溜まっているけれど、再生して見る時間が取れない方
研修動画・セミナー動画を、読み返せる資料に変えておきたい方
操作手順書を作る作業を、毎回ゼロからやるのが負担になっている方
動画コンテンツを検索・引用・共有しやすい形にしたい方
動画を扱う仕事をしていて、動画まわりの作業時間を減らしたい方
こんな方には向きません
動画をじっくり「視聴体験として」味わいたい方(このスキルは情報を取り出す道具です)
生成されたマニュアルに最終チェックすら入れるつもりがない方(公開・配布前の確認は必要です)
ルール開発・プロンプトの試行錯誤そのものを楽しみたい方(その場合は自作をおすすめします)

注意事項
Claude Code(Anthropic の CLI ツール)が動作する環境が必要です(Mac / Windows)
Claude Code をまだお使いでない方にも対応できるよう、インストールから動作確認までの手順書を同梱しています
YouTube 動画を扱う場合、初回のみ Firefox に YouTube ログインする設定が必要です(同梱の YouTube セットアップ手順に沿って数分で完了します)。
ローカルの動画ファイルを扱う場合はこの設定は不要です
生成されたマニュアルは、公開・配布の前にご自身で内容をご確認ください
ここから先は購入者限定エリアです。
スキル本体(zip)と、すぐに動かすための Claude Code インストールマニュアル・YouTube セットアップ手順をお渡しします。

