AUA Japan 技術文書

セクション移動

AI国民プロフィールカード

source row loading

AI国民プロフィール

スライドショーを再生次のAI国民プロフィール

loading random source row

AI国民プロフィールカードを読み込み中...

Reports Collection

レポートを読み込み中...

AUA Japan 技術ノート

AUA Japanは、正式調査の前にAI国民へ問いを投げ、反応の仮説を磨く合成リサーチシステムです。

AUA Japanは単純な翻訳版ではありません。日本語UI、日本の公開統計、Nemotron Japanのソースペルソナ、JP向けプロンプト、レポート、DOC、法務文書ドラフトをひとつの国別アダプターとして分離します。メインコピーは `1億672万人のAI国民が答える` ですが、技術的には700万ソースペルソナを公式統計で加重して読む設計です。

106,720,000

マスタービルド

7,000,000

ソースペルソナ

12+

Datasets/Open Data

Schema

AI国民応答規格

Important limitation

AUA Japanは、実際の世論調査や正式な市場調査の代わりにはなりません。

AUAの調査結果は、実在する人の回答ではありません。同じ設問をAI国民による合成パネルへ投げかけて生成したシミュレーション結果です。 AUAは、正式な調査を実施する前に、アイデアやアンケート草案をリハーサルするためのAIリサーチコパイロットです。お客様はAUAの結果を使って、実際の回答者へ送る前に、伝わりにくい設問、効果の弱い設問、誤解を招きやすい設問を見つけ、設問文、回答選択肢、アンケート構成を磨くことができます。

Reliability Calibration

Public benchmark report

AUA Japanは、公開調査とどれくらい近いかを隠さず見せる形で信頼性を説明します。

信頼度点検レポートは、同じ設問に近い形で AUA AI国民へ問いを投げ、その結果を日本の公開調査と見比べる calibration 文書です。単に数字が近いかだけでなく、対象条件の近さ、回答の向き、分布の寄り方まで含めて見ます。だからここでは「完全に当たる」とは言わず、どこまで参考にしやすいかを `かなり近い`、`やや差がある`、`差が大きい` の3段階で見せます。

公開調査ベンチマーク

総務省、内閣府、国立社会保障・人口問題研究所などの公開調査と照合

close-match レポート

2/6

スマートフォン保有と未婚者の結婚意向は、対象条件が比較的安定した文脈

mild-gap レポート

3/6

性別役割観、生活程度、余暇・文化は方向は合うが強さに差が残る

outlier レポート

1/6

収入・資産不安のようなscreening条件つき文脈は大きく離れる

Six Japanese public benchmarks

実際の日本公開調査6件と合わせた calibration snapshot

下の数値はAUA Japanの公開ベンチマークレポートが見せる基本形です。6件のうち2件はclose-match、 3件はmild-gap、1件はoutlierとして配置しています。よく合ったケース、少し離れたケース、大きく外れたケースを同時に見せることで、どの領域なら先に仮説検証へ進めるか、どこは設問やcohortを見直すべきかを読みやすくします。

デジタル生活

スマートフォンを保有する

公開調査

80.0%+

AUA 国民

79.4%

差分

0.6pt

Benchmark fit90%

個人保有率はほぼ同じ水準に入った。スマートフォンのように生活インフラ化した行動は、AUA Japanでも比較的安定して再現しやすい。

総務省 2024年通信利用動向調査

結婚意向

未婚者はいずれ結婚するつもり

公開調査

82.9%

AUA 国民

89.7%

差分

6.9pt

Benchmark fit86%

18-34歳未婚者の結婚意向は公開調査より少し高く出たが、男女ともに高い意向が残る方向は揃った。cohortを絞れるテーマでは読みやすい。

国立社会保障・人口問題研究所第16回出生動向基本調査

性別役割観

伝統的な性別役割に賛成する

mild

公開調査

33.1%

AUA 国民

17.1%

差分

16.0pt

Benchmark fit67%

反対が多数派という方向は合ったが、AUA側では伝統的役割観への距離が強く出た。価値観設問は向きと強さを分けて読む必要がある。

内閣府男女共同参画社会に関する世論調査 2024

生活程度

自分の生活程度は中の中だと思う

mild

公開調査

46.7%

AUA 国民

26.2%

差分

20.5pt

Benchmark fit61%

中位帯を見る方向は合うが、AUAは「中の上」に寄りやすく、下側の自己認識が弱く出た。自己評価カテゴリは分布の読み替えが必要になる。

内閣府国民生活に関する世論調査 2024

余暇・文化

過去1年に趣味・娯楽をした

mild

公開調査

86.3%

AUA 国民

100.0%

差分

13.7pt

Benchmark fit70%

趣味・娯楽の方向は高く出る点で合うが、AUAは参加率を強く見積もる。2021年調査との時点差と成人中心frameの違いを残して読む。

総務省統計局令和3年社会生活基本調査

生活不安

今後の収入や資産に不安がある

outlier

公開調査

58.0%

AUA 国民

98.5%

差分

40.5pt

Benchmark fit44%

収入・資産不安はAUA側でかなり強く出た。screening条件つきの設問は、比較母集団の切り方がずれると差が大きく開きやすい。

内閣府国民生活に関する世論調査 2024

How to read AUA

AUA Japanの calibration を読むときの基本線

かなり近いとき

設問の方向感だけでなく、どの層に先に実調査を当てるかを考える初期判断材料として使いやすい状態です。

やや差があるとき

賛否や傾向の向きは参考にしつつ、選択肢設計や回答強度は次の実調査で必ず再確認する、という読み方が合います。

差が大きいとき

設問を捨てるよりも、screening 条件、時点差、対象 cohort の切り方に問題がないかを見直すヒントとして扱います。

正式調査の前に使う

AUA Japanの強みは、6件すべてを `close match` にすることではありません。どのテーマは先に仮説検証へ進めやすいか、どのテーマは設問や対象条件を再設計すべきかを、実調査の前に透明な形で見せられるところにあります。

Limitations

実在個人ではない

AI国民は実在の個人を複製したものではなく、公開統計と合成ペルソナから作るAI回答者です。

正式調査ではない

市場調査、世論調査、選挙予測、公的統計、専門的助言の代替として使わないでください。

時点差がある

価格急騰、災害、事件、流行、プラットフォーム変化の直後は、公開統計やソースペルソナとの時点差が大きくなります。

狭い対象に弱い

非常に狭いファン層、特定企業の顧客、直近購入者などは実データとの追加検証が必要です。

AI出力の揺れ

生成モデルの出力には誤り、偏り、JSON破損、表現の揺れがあり得ます。スキーマガードと再試行で抑えます。

精密な数字の錯覚

数千件の回答行があっても合成回答です。数字は判断の練習信号であり、実測値ではありません。

Pricing

クレジット単位

MeatPieは、AI国民に一人に聞けるのに必要なAUAクレジットの単位です。

1 MeatPie = AI国民 1人へアンケートが出来ます。基本2,000個単位にて購入出来ます。

対応式

1 MeatPie = AI国民 1人

回答生成人数とcredit消費を直感的に一致させるための単位です。

ベータ配布

新規アカウントには初回ログイン時に `2,000 MeatPie` を付与します。ベータ期間の購入上限や運用方針は告知に合わせて更新します。

購入

プロジェクトドックから Lemon Squeezyを通じて`2,000個` または `10,000個` を選んで購入できます。

Product Surface

ホーム

`1億672万人のAI国民が答える`を中心に、質問入力、資料添付、Raw回答、レポート、フォローアップチャットまでのプロダクト体験を日本語で見せます。

LAB

対象条件、設問、AI国民人数、MeatPie、実行状況、完了レポート、エクスポートを日本語ユーザーの作業画面として維持します。

DOC

英語ラベルのサイドバー構造は残しつつ、hover/active時のローカルラベルは日本語で表示します。AI国民プロフィールスライドも維持します。

レポート

Markdownレポート、回答表、CSV/JSONL、PDF、`レポート用スライドプロンプト`、フォローアップチャットを日本語の成果物として扱います。

Operation Architecture

Product Operating Map

プロダクト運用フロー図

入力、資料解釈、標本抽出、個別応答、検証と集計、成果物保存まで、プロダクトの複雑な運用フローを概念構造図として圧縮しました。

Schema guardedWeighted analyticsRun ledger主実行フロー非同期/保存フロー

Operations Rule

運用ルール

persona response concurrencyで速度と安定性を調整します。
AI国民生成に失敗した場合、実行を成功扱いにせず、警告または失敗として記録します。
source_context_jsonを実行記録に保存し、ワーカー、レポート、フォローアップチャットが同じ文脈を参照します。
全体実行が失敗した場合、予約済みクレジットを返金台帳で戻します。
フォローアップチャットは完了した実行の個別回答をもとに90分のセッションとして動きます。

AI Citizen Build

ソースペルソナの取り込み

`nvidia/Nemotron-Personas-Japan` の700万行をソースペルソナとして読み込みます。uuid、persona、prefecture、region、area、sex、age、occupationなどをJP schemaへ変換します。

非公開ソース索引の管理

Nemotron由来の個別行は非公開ソース索引として管理し、公開bundleには生のpersona全文を出しません。公開面には安全なcohort facetだけを出します。

公式統計による加重マスター

e-Stat、総務省統計局、人口推計などの日本公式統計を使い、年齢、性別、都道府県、世帯、就業、住居、生活領域の重みを付けます。

公開安全facet

LABの対象条件UIには、個人を推測できない集計済みfacetだけを渡します。JP master datasetのQAレポートとデータ辞書を別途残します。

JP master dataset成果物

Nemotron Japan + 日本公式統計によるmaster dataset

このmaster datasetは、7,000,000件の日本語ソースペルソナと日本公開統計を掛け合わせ、AI国民がどの生活文脈と市場条件を代表しているのかを、利用者がそのまま理解しやすい形へ整えた基盤です。

AUA-JP ID

各AI国民には共通IDが付き、レポート、回答一覧、フォローアップチャットまで同じ人物像を追いながら読み直せます。単発の回答ではなく、継続して比較できる基盤です。

7,000,000 ソースペルソナ

若年層から高齢層、都市生活者から地方生活者まで、日本語の生活文脈を持つ幅広いソースペルソナを土台にしているため、反応の違いを細かく読み分けられます。

日本公開統計による加重

人口推計や公開統計をもとに母集団の重みを整えているため、全国向けの仮説検証でも、対象条件を絞ったリサーチでも、日本市場らしい反応の輪郭を保ちやすくなります。

公開安全セグメント

ユーザーが触れるのは、安全に集約された対象条件とセグメント情報だけです。個人を推測できない形で、地域、年齢、就業、生活条件ごとの違いをそのまま比較できます。

Source Intake

Direct material

利用者の説明、政策案、商品紹介、キャンペーン文案を調査資料として整理し、日本語の判断文脈に圧縮します。

Files

PDF、DOCX、TXT、MD、PNG、JPG、WEBPを受け取り、文書はMarkdown要約、画像は製品・場面・価格・コピーの日本語説明に変換します。

Web links

URL本文から必要な文脈だけを取り出し、AI国民が読む調査資料に混ぜます。リンク本文をそのまま長文投入しません。

Source memory

完了した実行の資料要約は資料コンテキストとして残し、ワーカー、レポート、フォローアップチャットが同じ根拠を参照できるようにします。

Model Orchestration

AUA Japanのモデル層は、ひとつの巨大な回答者ではなく、役割の異なる複数の判断レイヤーとして設計します。素早い構造化応答、長文資料の読解、コスト効率の高い大量生成、スキーマ復旧と一貫性チェックを分けて、同じJP応答規格と検証器の下で運用します。

Primary reasoning layer

構造化JSON応答、画像説明、素早いAI国民回答の生成を担う中核レイヤーです。現在のJPプロダクトのリアルタイム実行は、この層を中心に速度と安定性を揃えます。

Long-context review

長い資料の読解や、政策・法務・ブランド文脈のようにじっくり読んで判断すべき実行では、補助判断や二次レビューとして使えるレイヤーです。

Scale and variation layer

大量応答、文案の言い換え比較、コスト効率が重要な生成タスクに向いたレイヤーです。大規模サンプルでも、同じJP応答契約のまま揺れを抑えて回せます。

Provider voting

重要な実行では、基準回答、一貫性チェック、スキーマ復旧を分けて処理できます。異常値や失敗を記録し、再試行ポリシーを適用して、結果が不用意にぶれないようにします。

Cognitive Engine

Persona-first response generation

AI国民は、都道府県、年齢、性別、職業、生活文脈、関心、資料、設問を読み、自分の条件に照らして回答します。あらかじめ決めた支持率を理由で飾るのではなく、個別の判断を作ってから集計します。

Persona response contract

input = {
  brief,
  sourceContext,
  cohort,
  personaProfile,
  questions,
  answerContract
}

output = {
  supportScore,
  confidence,
  segmentLabel,
  quote,
  answers[],
  objections[],
  attractionDrivers[]
}

Survey Taxonomy

意向・態度

購入意向、利用意向、視聴意向、好意度、共有意向

加重平均トップボックス信頼帯ドライバーモデル

政策・公共判断

政策賛否、公共施策、予算優先順位、地域課題

支持率セグメント比較反対理由抽出

候補・選択肢比較

ブランド名、商品案、パッケージ案、候補メッセージ

選択率ランキングスコア理由コード化

プロダクト機能・KANO

必須機能、魅力機能、不満要因、優先順位

KANO-lite重要度・満足度機能四象限

価格・収益化

月額、単発価格、無料体験、バンドル、価格抵抗

Van WestendorpGabor-GrangerWTP

メッセージ・リスク診断

誤解、反感、信頼障壁、危機対応コピー

トピック分類感情コード化代表引用

Statistics

記述統計

頻度、比率、加重平均、中央値、標準偏差、トップボックス/ボトムボックスで基本分布を示します。

不確実性

有効標本数、近似信頼区間、ブートストラップ区間、希少strata警告を併記します。

集団差

t-test、ANOVA、Mann-Whitney U、Kruskal-Wallis、Cohen's dなどで集団差を確認します。

ドライバーモデル

high intentやsupportを目的変数にし、反応を左右する要因を整理します。

自由回答コード化

自由回答を反対理由、魅力、誤解、信頼条件、価格障壁などに分類します。

加重平均とshare

weighted_mean = sum(w_i * x_i) / sum(w_i)

weighted_share = sum(w_i * I(condition_i)) / sum(w_i)

top_box = P(response in {4, 5})
bottom_box = P(response in {1, 2})

有効標本数

n_eff = (sum(w_i)^2) / sum(w_i^2)

SE(p_hat) = sqrt(p_hat * (1 - p_hat) / n_eff)

CI_95 = p_hat +/- 1.96 * SE(p_hat)

尺度信頼性

alpha = (k / (k - 1)) *
  (1 - sum(var(item_j)) / var(total_score))

item_total_corr = corr(item_j, total_score_without_j)

Sampling

Cohort normalization

都道府県、年齢帯、性別、就業、家族、住居、関心領域をAuaCohortSpecに正規化します。

Weighted sampling

public facetとpopulationWeightを使い、誰に聞くかを決めます。この段階では回答を生成しません。

Coverage warning

条件に合うソースペルソナが不足するときは警告を出し、希少strataの解釈を慎重にします。

Private response rows

個別回答はprivate response storeに残し、公開レポートは集計値と代表引用を中心に見せます。

Report Pipeline

draft

generateBrief

質問と資料を短い実行 brief として整理します。

sample

personaMatches + weightedSample

対象条件に合う回答者を選びます。

answer

generateOnePersonaResponse

各ペルソナが資料を読み、自分の立場で直接答えます。

validate

normalizeLlmPersonaResponse

スキーマと値の範囲を検証します。

aggregate

aggregateQuestion + buildSegments

統計値とセグメント差を計算します。

store

storeResult

レポート、個別回答、成果物を保存します。

Persona Chat

90-minute session

完了した実行の個別回答を根拠に、90分のフォローアップチャットを開きます。

Grounded in response

回答引用、設問回答、反対理由、魅力要因を読み、同じAI国民の文脈として会話します。

Not aggregate statistics

チャットは定性的な深掘りです。そこから出た発言を全体統計へ自動昇格しません。

Recommended use

反対理由を掘る、価格条件を詰める、次の設問案を作る用途に向いています。

Core Functions

buildAuaReportAsync(args)

lib/persona-engine.ts

実行の出発点です。API key を確認し、対象条件を正規化し、ペルソナ標本を選んだうえで、資料文脈を補強して応答生成を始めます。

generatePersonaResponses(...)

lib/persona-engine.ts

標本ペルソナを同時処理単位に分け、各AI国民の回答を並列に生成します。実際のアンケート回答生成はこの経路を中心に回ります。

generateOnePersonaResponse(...)

lib/persona-engine.ts

ペルソナプロフィール、brief、資料文脈、対象条件、設問、応答規格をモデルへ渡し、JSON 応答を受け取ります。事前に計算した支持率を流し込む設計ではありません。

normalizeLlmPersonaResponse(...)

lib/persona-engine.ts

モデルが返した支持スコア、確信度、セグメントラベル、回答、引用、反対理由、惹かれた理由を検証し、レポート行として整形します。

enrichSourceContext(...)

lib/persona-engine.ts

利用者入力、添付資料の要約、Web リンクを実行文脈へまとめます。リンク本文は必要な部分だけを短く抜き出し、AI国民が読める形へ圧縮します。

buildAuaReportFromResponses(...)

lib/persona-engine.ts

個別回答行を受け取り、レポート指標、設問別結果、セグメント差、代表意見、推奨アクションを計算します。

weightedSample(...)

lib/persona-engine.ts

ペルソナプールから対象条件と populationWeight を反映して標本を選びます。この関数は回答を生成せず、誰に聞くかだけを決めます。

aggregateQuestion(...)

lib/persona-engine.ts

設問ごとの加重平均、肯定・保留・否定の比率、自由回答の主要意見を集計します。

buildAuaCitizenId(...)

lib/aua-citizen-id.ts

`AUA-JP-00000001-001` 形式の AI国民 ID を生成し、日本プロジェクトの country-aware ID ポリシーを担います。

extractAssetText(...)

app/api/projects/[id]/assets/[assetId]/extract/route.ts

Storage から取得した PDF、DOCX、TXT、画像を Markdown 要約または日本語説明へ変換し、`extracted_text_summary` に保存します。

loadRunSourceContext(...)

scripts/aua_run_worker.ts

キューに入った full run を処理するとき、`source_context_json` と保存済み資料要約を合わせて、ペルソナ生成エンジンへ渡します。

API Contracts

CITIZEN ID Policy

type AuaCitizenId = "AUA-{COUNTRY}-{sourceSeq8}-{replicaSeq3}";

// JP canonical example
"AUA-JP-00000001-001"

Run Source Context

type AuaSourceContext = {
  material?: string;
  assetSummaries?: string[];
  assetIds?: string[];
  webLinks?: string[];
};

Persona Answer Row

type AuaPersonaResponse = {
  personaUuid: "AUA-JP-00000001-001";
  citizenId: "AUA-JP-00000001-001";
  regionLabel: string;
  segmentLabel: string;
  populationWeight: number;
  supportScore: number;
  confidence: number;
  answers: Array<{ questionId: string; value: number | string | string[]; reason: string }>;
  quote: string;
  objections: string[];
  attractionDrivers: string[];
};

Create Full Run

POST /api/projects/:id/runs

{
  "brief": AuaBrief,
  "cohort": AuaCohortSpec,
  "questions": AuaQuestion[],
  "sampleSize": 2000,
  "sourceContext": {
    "material": "日本語の入力資料",
    "assetIds": ["asset-id-001"],
    "assetSummaries": ["抽出した資料要約"],
    "webLinks": ["https://..."]
  }
}

Extract Asset

POST /api/projects/:id/assets/:assetId/extract

// Internal Storage から原本を読み、
// 文書テキストまたは画像説明を抽出したあと
// aua_assets.extracted_text_summary に保存します。

Data Sources

AUA Japanのソース層はNemotron Japanと日本公式統計を基準にします。下記はP2-P7で使う主要参照先です。 AUA Japanが各機関の公式統計プロダクトであるという意味ではありません。

Licenses

データセット出典表示

NVIDIA Nemotron-Personas-Japan データセット出典およびライセンス

本プロジェクトはNVIDIAのnvidia/Nemotron-Personas-Japanデータセットを使用します。同データセットはCC BY 4.0ライセンスで提供され、適切な出典表示を条件に共有、改変、再配布、商用利用が可能です。

データセット: nvidia/Nemotron-Personas-Japan
提供者: NVIDIA
ライセンス: Creative Commons Attribution 4.0 International (CC BY 4.0)
利用目的: AUA Japanの合成AI回答者ソース、標本抽出、統計補正、リサーチ回答生成の文脈で利用します。
注意: 本プロジェクトはNVIDIAの公式製品、保証、後援、代理運用サービスではありません。

データセット出典ライセンス本文

セクション移動

AI国民プロフィール

AUA Japanは、正式調査の前にAI国民へ問いを投げ、反応の仮説を磨く合成リサーチシステムです。

AUA Japanは、実際の世論調査や正式な市場調査の代わりにはなりません。

Reliability Calibration

AUA Japanは、公開調査とどれくらい近いかを隠さず見せる形で信頼性を説明します。

実際の日本公開調査6件と合わせた calibration snapshot

スマートフォンを保有する

未婚者はいずれ結婚するつもり

伝統的な性別役割に賛成する

自分の生活程度は中の中だと思う

過去1年に趣味・娯楽をした

今後の収入や資産に不安がある

AUA Japanの calibration を読むときの基本線

かなり近いとき

やや差があるとき

差が大きいとき

正式調査の前に使う

Limitations

実在個人ではない

正式調査ではない

時点差がある

狭い対象に弱い

AI出力の揺れ

精密な数字の錯覚

Pricing

MeatPieは、AI国民に一人に聞けるのに必要なAUAクレジットの単位です。

対応式

ベータ配布

購入

Product Surface

ホーム

LAB

DOC

レポート

Operation Architecture

プロダクト運用フロー図

運用ルール

AI Citizen Build

ソースペルソナの取り込み

非公開ソース索引の管理

公式統計による加重マスター

公開安全facet

Nemotron Japan + 日本公式統計によるmaster dataset

AUA-JP ID

7,000,000 ソースペルソナ

日本公開統計による加重

公開安全セグメント

Source Intake

Direct material

Files

Web links

Source memory

Model Orchestration

Primary reasoning layer

Long-context review

Scale and variation layer

Provider voting

Cognitive Engine

Persona-first response generation

Persona response contract

Survey Taxonomy

意向・態度

政策・公共判断

候補・選択肢比較

プロダクト機能・KANO

価格・収益化

メッセージ・リスク診断

Statistics

記述統計

不確実性

集団差

関連分析

ドライバーモデル

自由回答コード化

加重平均とshare

有効標本数

関連指標

尺度信頼性

Sampling

総務省通信利用動向調査