記事制作パイプライン 全体図

pink-lab-articles プロジェクトの Phase 1〜6 ワークフロー

ピンク研究所(SEO / SNS)

リサーチフェーズ

Phase 1 〜 3.8
1 データ収集(e-Stat) 統計データ

e-Stat MCPで政府統計データを検索・取得し、記事の根拠となる数字を収集する。

  1. 1e-stat MCPで統計データを検索・取得 MCP: e-stat
  2. 2データを data/estat_[テーマ].json に保存(プロジェクト横断・data/直下)
  3. 3要点を data/estat_[テーマ]_summary.md にまとめる
  4. 4JSONの生データは以降のPhaseでは読み込まない(サマリーのみ使う)
data/estat_{テーマ}.json data/estat_{テーマ}_summary.md
2 Xリサーチ SNS声・トレンド

x-search MCPでXの投稿を収集し、当事者の声・トレンド・数字を拾う。

  1. 1x-search MCPで関連投稿を収集 MCP: x-search
  2. 2結果を data/{seo|sns}/x_[テーマ].json に保存
  3. 3有用な声・傾向・数字を *_summary.md にまとめる
  4. 4当事者の声はプライバシー配慮のうえ要旨をメモする
data/{cat}/x_{テーマ}.json data/{cat}/x_{テーマ}_summary.md
3 Web検索リサーチ 補足情報

時事ネタ、海外事例、競合記事をWeb検索で収集し、記事の厚みを出す素材を集める。

  1. 1Web検索で競合記事・海外事例・時事ネタを収集
  2. 2要点を data/{seo|sns}/web_[テーマ]_summary.md にまとめる
data/{cat}/web_{テーマ}_summary.md
3.5 法令・判例リサーチ 該当テーマのみ 条文引用

法令が絡むテーマで実施。e-Gov法令検索MCPで条文を取得し、正確な法的根拠を確保する。

  1. 1e-gov-law MCPで関連法令の条文を取得 MCP: e-gov-law
  2. 2引用する条文・罰則を正確に確認する
  3. 3要点を data/{cat}/law_[テーマ]_summary.md にまとめる

ピンク研究所で該当する法令例

  • 風営法、売春防止法、児童福祉法
  • 出会い系サイト規制法、児童買春禁止法
  • 所得税法(副業・確定申告)
  • 労働基準法、職安法
data/{cat}/law_{テーマ}_summary.md
3.8 NLP競合分析 自動実行 エンティティ設計図

Google Cloud Natural Language APIで競合上位3ページを分析し、記事に盛り込むべきエンティティの設計図を作る。リサーチ完了後、執筆前に必ず実行。

python3 scripts/nlp_pre_analysis.py --keyword "パパ活 確定申告" --urls "URL1" "URL2" "URL3"
  1. 1ターゲットKWでWeb検索 → 上位3ページの本文を取得
  2. 2analyzeEntities(エンティティ + サリエンス) NLP API v1
  3. 3classifyText(カテゴリ分類) NLP API v2
  4. 4エンティティを集約 → Tier 1(全競合共通 or サリエンス≧0.1)/ Tier 2(2/3以上)に分類
  5. 5「記事に必ず含めるべきエンティティリスト」を生成・保存
data/{cat}/nlp_{テーマ}_pre_analysis.md data/{cat}/nlp_{テーマ}_pre_analysis.json

執筆フェーズ

Phase 4
4 記事執筆 HTML + MD

サマリーファイルのみを読み込み(JSONは読まない)、ライティングガイドに沿って執筆する。

読み込むファイル(サマリーのみ) estat_{テーマ}_summary.md / x_{テーマ}_summary.md / web_{テーマ}_summary.md / law_{テーマ}_summary.md / nlp_{テーマ}_pre_analysis.md

ピンク研究所ライティングガイド

guides/pink-lab-writing-guide-v2.md
  • カジュアル文体(ちゃん付け・くだけた口語)
  • ピンク配色(#FF69B4系グラデーション)
  • パパ活女子・夜職女子向けトーン
  • ニュース記事は絵文字付き見出し
AIO最適化ルール(全記事共通)
冒頭50〜70字で検索意図への主答を配置
各H2をIsland Test前提で構造化
FAQセクション 3〜5問
NLPエンティティ設計図を意識して配置
H2直下にリード文(即H3はNG)
1 H2内に複数トピック → H3で分割
output/{cat}/YYYYMMDD-KW/YYYYMMDD-KW.html output/{cat}/YYYYMMDD-KW/YYYYMMDD-KW.md

品質保証フェーズ

Phase 5 〜 6(自動実行)
5 執筆後NLP分析 + 文体チェック 自動実行 差分チェック

記事をNLP APIで分析し、Phase 3.8の競合データとのエンティティギャップを抽出。ガイドライン文体チェックも同時実行。

python3 scripts/nlp_analyze_competitors.py output/seo/20260220-ソープ 歴史/20260220-ソープ 歴史.html
  1. 1記事HTMLからテキスト抽出 → analyzeEntities + classifyText NLP API
  2. 2Phase 3.8の競合データ(.json)と差分チェック
  3. 3ガイドライン文体チェック(NG表現13種・曖昧3種・冗長3種・構造2種)
  4. 4ギャップに基づいて記事を修正 → 再チェック
NG表現(さまざまな、〜において、等13種)
曖昧表現(〜しやすい、〜の可能性がある)
冗長修飾語(基本的な、具体的な、一般的な)
「〜します:」+ 箇条書きパターン
H2直下にリード文がない
Tier 1エンティティ全カバー
サリエンス水準(競合の50%以上)
カテゴリ分類の一致
data/{cat}/nlp_{テーマ}_post_analysis.md
6 構造化データ生成・バリデーション 自動実行 JSON-LD

記事HTMLからJSON-LDを自動生成し、バリデーション後に<head>に埋め込む。

python3 scripts/generate_jsonld.py output/seo/20260220-ソープ 歴史/20260220-ソープ 歴史.html
  1. 1generate_jsonld.py → Article / FAQPage / HowTo 生成 Python
  2. 2validate_rich_results.py でバリデーション Python
  3. 3エラーなければ HTML の <head> に直接埋め込み
{記事名}_jsonld.json HTML <head> に埋め込み
+ 画像生成(オプション) 必要な場合のみ Gemini API

記事HTMLからH2を自動検出し、Gemini APIでまとめ画像 + 各セクション画像を一括生成する。

python3 scripts/article_images.py output/seo/記事.html --preset pink --aspect 9:16
  1. 1記事HTMLからH2見出しを自動検出
  2. 2Gemini API(gemini-3-pro-image-preview)でインフォグラフィック画像生成 Gemini API
  3. 3出力: summary.jpg + h2-01〜h2-N.jpg を images/ フォルダに保存
output/{cat}/YYYYMMDD-KW/images/summary.jpg output/{cat}/YYYYMMDD-KW/images/h2-01.jpg 〜

所要時間・月産キャパシティ

Performance
1記事あたり 約24分 画像生成込み

Phase 1〜6 + 画像生成を含めた1記事の平均制作時間。バッチ処理を活用すれば1日10本以上も可能。

1 KW選定・データ収集 3分
2 X・Webリサーチ 5分
3 サマリー作成 1分
3.8 NLP競合分析 2分
4 記事執筆(HTML + MD) 5分
5 NLP差分チェック + 文体チェック 2分
6 JSON-LD生成 + バリデーション 2分
+ 画像生成(Gemini API) 2分
合計 約24分
100本
月産キャパシティ
1日5本 × 20営業日
3テーマ
並行リサーチ可能数
Phase 1〜3を同時進行
10本+
バッチ処理時 / 日
同テーマの記事を連続制作

ツール・API・MCP 依存関係

🔌
e-stat MCP
政府統計データ取得
🔌
x-search MCP
X投稿検索
🔌
e-gov-law MCP
法令条文検索(APIキー不要)
🔑
Google NLP API
.env → GOOGLE_NLP_API_KEY
🔑
Gemini API
.env → GEMINI_API_KEY
📜
article_images.py
Gemini画像一括生成
📜
generate_jsonld.py
JSON-LD生成
📜
validate_rich_results.py
JSON-LDバリデーション
🐍
Python 3.9+
標準ライブラリ + python-dotenv(optional)

記事出力フォーマット

output/{seo|sns}/YYYYMMDD-キーワード/
├── YYYYMMDD-キーワード.html ← 記事本体(CSS埋込・JSON-LD付き)
├── YYYYMMDD-キーワード.md ← MD変換版(5法則に準拠)
└── images/ ← article_images.pyで生成(必要な場合)
    ├── summary.jpg
    ├── h2-01.jpg
    └── ...
最終更新: 2026-02-25 | pink-lab-articles プロジェクト