1
データ収集(e-Stat)
統計データ
e-Stat MCPで政府統計データを検索・取得し、記事の根拠となる数字を収集する。
- 1e-stat MCPで統計データを検索・取得 MCP: e-stat
- 2データを
data/estat_[テーマ].json に保存(プロジェクト横断・data/直下)
- 3要点を
data/estat_[テーマ]_summary.md にまとめる
- 4JSONの生データは以降のPhaseでは読み込まない(サマリーのみ使う)
data/estat_{テーマ}.json
data/estat_{テーマ}_summary.md
↓
2
Xリサーチ
SNS声・トレンド
x-search MCPでXの投稿を収集し、当事者の声・トレンド・数字を拾う。
- 1x-search MCPで関連投稿を収集 MCP: x-search
- 2結果を
data/{seo|sns}/x_[テーマ].json に保存
- 3有用な声・傾向・数字を
*_summary.md にまとめる
- 4当事者の声はプライバシー配慮のうえ要旨をメモする
data/{cat}/x_{テーマ}.json
data/{cat}/x_{テーマ}_summary.md
↓
3
Web検索リサーチ
補足情報
時事ネタ、海外事例、競合記事をWeb検索で収集し、記事の厚みを出す素材を集める。
- 1Web検索で競合記事・海外事例・時事ネタを収集
- 2要点を
data/{seo|sns}/web_[テーマ]_summary.md にまとめる
data/{cat}/web_{テーマ}_summary.md
↓
3.5
法令・判例リサーチ
該当テーマのみ
条文引用
法令が絡むテーマで実施。e-Gov法令検索MCPで条文を取得し、正確な法的根拠を確保する。
- 1e-gov-law MCPで関連法令の条文を取得 MCP: e-gov-law
- 2引用する条文・罰則を正確に確認する
- 3要点を
data/{cat}/law_[テーマ]_summary.md にまとめる
ピンク研究所で該当する法令例
- 風営法、売春防止法、児童福祉法
- 出会い系サイト規制法、児童買春禁止法
- 所得税法(副業・確定申告)
- 労働基準法、職安法
data/{cat}/law_{テーマ}_summary.md
↓
3.8
NLP競合分析
自動実行
エンティティ設計図
Google Cloud Natural Language APIで競合上位3ページを分析し、記事に盛り込むべきエンティティの設計図を作る。リサーチ完了後、執筆前に必ず実行。
python3 scripts/nlp_pre_analysis.py --keyword "パパ活 確定申告" --urls "URL1" "URL2" "URL3"
- 1ターゲットKWでWeb検索 → 上位3ページの本文を取得
- 2analyzeEntities(エンティティ + サリエンス) NLP API v1
- 3classifyText(カテゴリ分類) NLP API v2
- 4エンティティを集約 → Tier 1(全競合共通 or サリエンス≧0.1)/ Tier 2(2/3以上)に分類
- 5「記事に必ず含めるべきエンティティリスト」を生成・保存
data/{cat}/nlp_{テーマ}_pre_analysis.md
data/{cat}/nlp_{テーマ}_pre_analysis.json
5
執筆後NLP分析 + 文体チェック
自動実行
差分チェック
記事をNLP APIで分析し、Phase 3.8の競合データとのエンティティギャップを抽出。ガイドライン文体チェックも同時実行。
python3 scripts/nlp_analyze_competitors.py output/seo/20260220-ソープ 歴史/20260220-ソープ 歴史.html
- 1記事HTMLからテキスト抽出 → analyzeEntities + classifyText NLP API
- 2Phase 3.8の競合データ(.json)と差分チェック
- 3ガイドライン文体チェック(NG表現13種・曖昧3種・冗長3種・構造2種)
- 4ギャップに基づいて記事を修正 → 再チェック
NG表現(さまざまな、〜において、等13種)
曖昧表現(〜しやすい、〜の可能性がある)
冗長修飾語(基本的な、具体的な、一般的な)
「〜します:」+ 箇条書きパターン
H2直下にリード文がない
Tier 1エンティティ全カバー
サリエンス水準(競合の50%以上)
カテゴリ分類の一致
data/{cat}/nlp_{テーマ}_post_analysis.md
↓
6
構造化データ生成・バリデーション
自動実行
JSON-LD
記事HTMLからJSON-LDを自動生成し、バリデーション後に<head>に埋め込む。
python3 scripts/generate_jsonld.py output/seo/20260220-ソープ 歴史/20260220-ソープ 歴史.html
- 1generate_jsonld.py → Article / FAQPage / HowTo 生成 Python
- 2validate_rich_results.py でバリデーション Python
- 3エラーなければ HTML の <head> に直接埋め込み
{記事名}_jsonld.json
HTML <head> に埋め込み
↓
+
画像生成(オプション)
必要な場合のみ
Gemini API
記事HTMLからH2を自動検出し、Gemini APIでまとめ画像 + 各セクション画像を一括生成する。
python3 scripts/article_images.py output/seo/記事.html --preset pink --aspect 9:16
- 1記事HTMLからH2見出しを自動検出
- 2Gemini API(gemini-3-pro-image-preview)でインフォグラフィック画像生成 Gemini API
- 3出力: summary.jpg + h2-01〜h2-N.jpg を images/ フォルダに保存
output/{cat}/YYYYMMDD-KW/images/summary.jpg
output/{cat}/YYYYMMDD-KW/images/h2-01.jpg 〜