記事制作パイプライン全体図

pink-lab-articles プロジェクトの Phase 1〜6 ワークフロー

ピンク研究所（SEO / SNS）

リサーチフェーズ

Phase 1 〜 3.8

1 データ収集（e-Stat）統計データ

e-Stat MCPで政府統計データを検索・取得し、記事の根拠となる数字を収集する。

1e-stat MCPで統計データを検索・取得 MCP: e-stat
2データを data/estat_[テーマ].json に保存（プロジェクト横断・data/直下）
3要点を data/estat_[テーマ]_summary.md にまとめる
4JSONの生データは以降のPhaseでは読み込まない（サマリーのみ使う）

data/estat_{テーマ}.json data/estat_{テーマ}_summary.md

↓

2 Xリサーチ SNS声・トレンド

x-search MCPでXの投稿を収集し、当事者の声・トレンド・数字を拾う。

1x-search MCPで関連投稿を収集 MCP: x-search
2結果を data/{seo|sns}/x_[テーマ].json に保存
3有用な声・傾向・数字を *_summary.md にまとめる
4当事者の声はプライバシー配慮のうえ要旨をメモする

data/{cat}/x_{テーマ}.json data/{cat}/x_{テーマ}_summary.md

↓

3 Web検索リサーチ補足情報

時事ネタ、海外事例、競合記事をWeb検索で収集し、記事の厚みを出す素材を集める。

1Web検索で競合記事・海外事例・時事ネタを収集
2要点を data/{seo|sns}/web_[テーマ]_summary.md にまとめる

data/{cat}/web_{テーマ}_summary.md

↓

3.5 法令・判例リサーチ該当テーマのみ条文引用

法令が絡むテーマで実施。e-Gov法令検索MCPで条文を取得し、正確な法的根拠を確保する。

1e-gov-law MCPで関連法令の条文を取得 MCP: e-gov-law
2引用する条文・罰則を正確に確認する
3要点を data/{cat}/law_[テーマ]_summary.md にまとめる

ピンク研究所で該当する法令例

風営法、売春防止法、児童福祉法
出会い系サイト規制法、児童買春禁止法
所得税法（副業・確定申告）
労働基準法、職安法

data/{cat}/law_{テーマ}_summary.md

↓

3.8 NLP競合分析自動実行エンティティ設計図

Google Cloud Natural Language APIで競合上位3ページを分析し、記事に盛り込むべきエンティティの設計図を作る。リサーチ完了後、執筆前に必ず実行。

python3 scripts/nlp_pre_analysis.py --keyword "パパ活確定申告" --urls "URL1" "URL2" "URL3"

1ターゲットKWでWeb検索 → 上位3ページの本文を取得
2analyzeEntities（エンティティ + サリエンス） NLP API v1
3classifyText（カテゴリ分類） NLP API v2
4エンティティを集約 → Tier 1（全競合共通 or サリエンス≧0.1）/ Tier 2（2/3以上）に分類
5「記事に必ず含めるべきエンティティリスト」を生成・保存

data/{cat}/nlp_{テーマ}_pre_analysis.md data/{cat}/nlp_{テーマ}_pre_analysis.json

執筆フェーズ

Phase 4

4 記事執筆 HTML + MD

サマリーファイルのみを読み込み（JSONは読まない）、ライティングガイドに沿って執筆する。

読み込むファイル（サマリーのみ） estat_{テーマ}_summary.md / x_{テーマ}_summary.md / web_{テーマ}_summary.md / law_{テーマ}_summary.md / nlp_{テーマ}_pre_analysis.md

ピンク研究所ライティングガイド

guides/pink-lab-writing-guide-v2.md

カジュアル文体（ちゃん付け・くだけた口語）
ピンク配色（#FF69B4系グラデーション）
パパ活女子・夜職女子向けトーン
ニュース記事は絵文字付き見出し

AIO最適化ルール（全記事共通）

冒頭50〜70字で検索意図への主答を配置

各H2をIsland Test前提で構造化

FAQセクション 3〜5問

NLPエンティティ設計図を意識して配置

H2直下にリード文（即H3はNG）

1 H2内に複数トピック → H3で分割

output/{cat}/YYYYMMDD-KW/YYYYMMDD-KW.html output/{cat}/YYYYMMDD-KW/YYYYMMDD-KW.md

品質保証フェーズ

Phase 5 〜 6（自動実行）

5 執筆後NLP分析 + 文体チェック自動実行差分チェック

記事をNLP APIで分析し、Phase 3.8の競合データとのエンティティギャップを抽出。ガイドライン文体チェックも同時実行。

python3 scripts/nlp_analyze_competitors.py output/seo/20260220-ソープ歴史/20260220-ソープ歴史.html

1記事HTMLからテキスト抽出 → analyzeEntities + classifyText NLP API
2Phase 3.8の競合データ（.json）と差分チェック
3ガイドライン文体チェック（NG表現13種・曖昧3種・冗長3種・構造2種）
4ギャップに基づいて記事を修正 → 再チェック

NG表現（さまざまな、〜において、等13種）

曖昧表現（〜しやすい、〜の可能性がある）

冗長修飾語（基本的な、具体的な、一般的な）

「〜します：」+ 箇条書きパターン

H2直下にリード文がない

Tier 1エンティティ全カバー

サリエンス水準（競合の50%以上）

カテゴリ分類の一致

data/{cat}/nlp_{テーマ}_post_analysis.md

↓

6 構造化データ生成・バリデーション自動実行 JSON-LD

記事HTMLからJSON-LDを自動生成し、バリデーション後に<head>に埋め込む。

python3 scripts/generate_jsonld.py output/seo/20260220-ソープ歴史/20260220-ソープ歴史.html

1generate_jsonld.py → Article / FAQPage / HowTo 生成 Python
2validate_rich_results.py でバリデーション Python
3エラーなければ HTML の <head> に直接埋め込み

{記事名}_jsonld.json HTML <head> に埋め込み

↓

+ 画像生成（オプション）必要な場合のみ Gemini API

記事HTMLからH2を自動検出し、Gemini APIでまとめ画像 + 各セクション画像を一括生成する。

python3 scripts/article_images.py output/seo/記事.html --preset pink --aspect 9:16

1記事HTMLからH2見出しを自動検出
2Gemini API（gemini-3-pro-image-preview）でインフォグラフィック画像生成 Gemini API
3出力: summary.jpg + h2-01〜h2-N.jpg を images/ フォルダに保存

output/{cat}/YYYYMMDD-KW/images/summary.jpg output/{cat}/YYYYMMDD-KW/images/h2-01.jpg 〜

所要時間・月産キャパシティ

Performance

⏱ 1記事あたり約24分画像生成込み

Phase 1〜6 + 画像生成を含めた1記事の平均制作時間。バッチ処理を活用すれば1日10本以上も可能。

1	KW選定・データ収集	3分
2	X・Webリサーチ	5分
3	サマリー作成	1分
3.8	NLP競合分析	2分
4	記事執筆（HTML + MD）	5分
5	NLP差分チェック + 文体チェック	2分
6	JSON-LD生成 + バリデーション	2分
+	画像生成（Gemini API）	2分
	合計	約24分

100本

月産キャパシティ

1日5本 × 20営業日

3テーマ

並行リサーチ可能数

Phase 1〜3を同時進行

10本+

バッチ処理時 / 日

同テーマの記事を連続制作

ツール・API・MCP 依存関係

🔌

e-stat MCP

政府統計データ取得

🔌

x-search MCP

X投稿検索

🔌

e-gov-law MCP

法令条文検索（APIキー不要）

🔑

Google NLP API

.env → GOOGLE_NLP_API_KEY

🔑

Gemini API

.env → GEMINI_API_KEY

📜

article_images.py

Gemini画像一括生成

📜

generate_jsonld.py

JSON-LD生成

📜

validate_rich_results.py

JSON-LDバリデーション

🐍

Python 3.9+

標準ライブラリ + python-dotenv(optional)

記事出力フォーマット

output/{seo|sns}/YYYYMMDD-キーワード/
├── YYYYMMDD-キーワード.html ← 記事本体（CSS埋込・JSON-LD付き）
├── YYYYMMDD-キーワード.md ← MD変換版（5法則に準拠）
└── images/ ← article_images.pyで生成（必要な場合）
    ├── summary.jpg
    ├── h2-01.jpg
    └── ...

最終更新: 2026-02-25 ｜ pink-lab-articles プロジェクト

記事制作パイプライン 全体図