AI国民プロフィールカード

source row loading

AI国民プロフィール

スライドショーを再生次のAI国民プロフィール

loading random source row

AI国民プロフィールカードを読み込み中...

AUA Japan 技術ノート

AUA Japanは、正式調査の前にAI国民へ問いを投げ、反応の仮説を磨く合成リサーチシステムです。

AUA Japanは単純な翻訳版ではありません。日本語UI、日本の公開統計、Nemotron Japan source persona、JP向けprompt、レポート、DOC、法務ドラフトを ひとつの国別adapterとして分離します。メインコピーは `1億人のAI国民が答える` ですが、技術的には100万source personaを公式統計で加重して読む設計です。

1億人
メインコピー
1,000,000
source persona
AUA-JP
Citizen ID
ja-JP
Locale

Reliability Calibration

JP校正sourceレジストリ

日本公開調査のsource候補値を整理し、AUA実行値とは分けて検証します。

ここでは完成済みの精度を主張しません。P7では下記6つの一次公開調査を基準に、同じ設問、近い選択肢、近い対象条件を使い、日本の公開調査とAUA JapanのAI国民回答を比較します。 close、mild gap、outlierを分け、数字が近いかだけでなく、選択肢順位、セグメント方向、自由回答の理由コードも確認します。

JP校正ステータス
P7出典レジストリ

日本公開調査のsource候補値を整理し、AUA実行値は未実行として分けます。

実行source方針
1M

Nemotron Japan 100万source personaを実行母体として扱います。

母集団表現
約1億

1億件のLLM callやDB rowではなく、加重母集団として説明します。

レポート姿勢
未検証値なし

正式調査の代替ではなく、仮説を磨くリハーサルとして読ませます。

生活不安

国民生活に関する世論調査(令和6年8月調査)

出典

内閣府 · 2024 · 日頃の生活の中で、悩みや不安を感じている/どちらかといえば感じていると答えた者

悩みや不安を感じているのはどのようなことについてですか。

自分の健康について63.8%
老後の生活設計について62.8%
今後の収入や資産の見通しについて58%

AUA設問ドラフト

日頃の生活の中で悩みや不安を感じるとしたら、主にどのようなことについてですか。

上位項目の順位、各項目share、理由コードを比較する。全人口比ではなくscreened respondent比として扱う。

AUA実行待ち

性別役割観

男女共同参画社会に関する世論調査(令和6年9月調査)

出典

内閣府 男女共同参画局 · 2024 · 全国18歳以上の日本国籍を有する者

「夫は外で働き、妻は家庭を守るべきである」という考え方について、どう考えるか。

賛成(賛成 + どちらかといえば賛成)33.1%
反対(どちらかといえば反対 + 反対)64.8%

AUA設問ドラフト

「夫は外で働き、妻は家庭を守るべきである」という考え方について、あなたはどう思いますか。

賛成/反対の小計、年齢別方向、反対理由の上位コードを比較する。

AUA実行待ち

デジタル生活

2024年通信利用動向調査

出典

総務省 · 2024 · 世帯主が20歳以上の世帯、および6歳以上の世帯構成員

世帯・個人におけるスマートフォン保有状況。

スマートフォンを保有する世帯90.5%
スマートフォンを保有する個人80%超

AUA設問ドラフト

あなたの世帯ではスマートフォンを保有していますか。また、あなた自身はスマートフォンを保有していますか。

世帯保有率90.5%をprimary anchor、個人保有80%超をdirectional anchorとして扱う。

AUA実行待ち

結婚意向

第16回出生動向基本調査(結婚と出産に関する全国調査)

出典

国立社会保障・人口問題研究所 · 2021 · 18-34歳の未婚者

未婚者の生涯の結婚意思。

いずれ結婚するつもり(男性)81.4%
いずれ結婚するつもり(女性)84.3%

AUA設問ドラフト

あなたは、いずれ結婚するつもりですか。

男女別shareを別々に比較し、maritalStatus近似による母集団差を明記する。

AUA実行待ち

余暇・文化

令和3年社会生活基本調査

出典

総務省統計局 · 2021 · 日本に住む10歳以上

過去1年間の自由時間等における主な活動の行動者率。

趣味・娯楽86.3%
スポーツ66.5%
旅行・行楽49.5%

AUA設問ドラフト

過去1年間に、趣味・娯楽、スポーツ、旅行・行楽をしましたか。

活動カテゴリ別の行動者率と順位を比較する。時点差とコロナ影響をoutlier候補として扱う。

AUA実行待ち

住生活・生活程度

国民生活に関する世論調査(令和6年8月調査)

出典

内閣府 · 2024 · 全国18歳以上

生活の程度は、世間一般から見て、どうか。

1.7%
中の上14.2%
中の中46.7%

AUA設問ドラフト

あなたの生活の程度は、世間一般から見てどのあたりだと思いますか。

5-category distribution、middle category concentration、lower-side shareを比較する。

AUA実行待ち

正式調査の前に使う

AUA Japanは結論を出す装置ではありません。質問を磨き、反対理由を発見し、どのセグメントに正式調査を当てるべきかを決めるためのリハーサルです。

Limitations

実在個人ではない

AI国民は実在の個人を複製したものではなく、公開統計と合成ペルソナから作るAI回答者です。

正式調査ではない

市場調査、世論調査、選挙予測、公的統計、専門的助言の代替として使わないでください。

時点差がある

価格急騰、災害、事件、流行、プラットフォーム変化の直後は、公開統計やsource personaとの時点差が大きくなります。

狭い対象に弱い

非常に狭いファン層、特定企業の顧客、直近購入者などは実データとの追加検証が必要です。

AI出力の揺れ

生成モデルの出力には誤り、偏り、JSON破損、表現の揺れがあり得ます。schema guardと再試行で抑えます。

精密な数字の錯覚

数千件の回答行があっても合成回答です。数字は判断の練習信号であり、実測値ではありません。

Pricing

クレジット単位

MeatPieは、AI国民に何人聞くかを数えるAUAの単位です。

JP版でも単位は変えません。`1 MeatPie = AI国民 1人` と説明し、2,000人のrunは2,000 MeatPieとして扱います。

対応式

1 MeatPie = AI国民 1人

回答生成人数とcredit消費を直感的に一致させるための単位です。

ベータ配布

新規利用者向けの初期付与やベータ期間の上限は、運用画面と告知に合わせて更新します。

購入

正式な販売条件は未確定です。ベータ期間中は追加提供や制限を運営側で管理します。

Product Surface

ホーム

`1億人のAI国民が答える`を中心に、質問入力、資料添付、Raw回答、レポート、フォローアップチャットまでの製品の流れを日本語で見せます。

LAB

対象条件、設問、AI国民人数、MeatPie、実行状況、完了レポート、エクスポートを日本語ユーザーの作業画面として維持します。

DOC

英語ラベルのサイドバー構造は残し、hover/active時のローカルラベルを日本語で表示します。AI国民プロフィールスライドも削除しません。

レポート

Markdownレポート、回答表、CSV/JSONL、PDF、`レポート用スライドプロンプト`、フォローアップチャットを日本語の成果物として扱います。

Operation Architecture

プロダクト運用map

AUA Japan 実行アーキテクチャ

INPUT

質問・資料

日本語の調査テーマ、PDF、画像、URL、対象条件を受け取る。

INTAKE

資料文脈化

文書と画像をAI国民が読める短い日本語文脈へ圧縮する。

SAMPLE

AI国民標本

JP public facetsとsource personaから対象者を抽出する。

ENGINE

個別判断

support、confidence、answers、quote、objectionsを生成する。

REPORT

成果物

Markdown、回答表、CSV/JSONL、スライドプロンプト、チャットへ渡す。

実行時ノート

persona response concurrencyで速度と安定性を調整します。
AI国民生成に失敗した場合、実行を成功扱いにせず、警告または失敗として記録します。
source_context_jsonをrunに保存し、worker、report、follow-up chatが同じ文脈を参照します。
全体実行が失敗した場合、credit reservationをrefund ledgerで戻します。
follow-up chatは完了runの個別回答をもとに72時間のセッションとして動きます。

AI Citizen Build

1. Source persona取込

`nvidia/Nemotron-Personas-Japan` の100万行をsource personaとして読み込みます。uuid、persona、prefecture、region、area、sex、age、occupationなどをJP schemaへ変換します。

2. Private source index管理

Nemotron由来の個別行はprivate source indexとして管理し、公開bundleには生のpersona全文を出しません。公開面には安全なcohort facetだけを出します。

3. 公式統計加重master

e-Stat、総務省統計局、人口推計などの日本公式統計を使い、年齢、性別、都道府県、世帯、就業、住居、生活領域の重みを付けます。

4. 公開safe facet

LABの対象条件UIには、個人を推測できない集計済みfacetだけを渡します。JP master datasetのQA reportとdata dictionaryを別途残します。

JP master dataset成果物

Nemotron Japan + 日本公式統計によるmaster dataset

P2からP4では、単にparquetを読み込むだけでなく、private source index、official weighted enrichment master、public-safe cohort facets、QA report、data dictionaryを作ります。

AUA-JP ID

`AUA-{COUNTRY}-{sourceSeq8}-{replicaSeq3}` を共通ポリシーにし、JPでは `AUA-JP-00000001-001` を標準形にします。旧 `AUA-KR-*` はparse互換だけ残します。

source_persona_only_1m

実行は100万source personaを基準にします。`1億人`のコピーは、1億件の生成や1億行保存ではなく、公式統計で加重した解釈母集団です。

QAレポート

欠損、都道府県分布、年齢・性別分布、重みの極端値、公開facetの丸め、再現可能なseedを検査して、P2-P4の完了条件にします。

データ辞書

source column、normalized column、公開可否、利用UI、重み計算、prompt利用可否をまとめ、次の国へのスピンオフにも流用できる形式にします。

Source Intake

直接資料

利用者の説明、政策案、商品紹介、キャンペーン文案を調査資料として整理し、日本語の判断文脈に圧縮します。

ファイル

PDF、DOCX、TXT、MD、PNG、JPG、WEBPを受け取り、文書はMarkdown要約、画像は製品・場面・価格・コピーの日本語説明に変換します。

Webリンク

URL本文から必要な文脈だけを取り出し、AI国民が読む調査資料に混ぜます。リンク本文をそのまま長文投入しません。

資料メモリ

完了runの資料要約はsource_contextとして残し、worker、report、follow-up chatが同じ根拠を参照できるようにします。

Model Orchestration

AUA Japanは、質問生成、資料要約、画像説明、AI国民回答、schema repair、レポート生成を同じ日本語product contractに正規化します。

日本語回答契約

設問、回答理由、反対理由、引用、セグメント名、レポート本文を日本語で生成し、他言語のfallbackが表に出ないようにします。

スキーマガード

supportScore、confidence、segmentLabel、answers、quote、objections、attractionDriversを検証し、壊れたJSONは修復または再試行します。

プロバイダー経路制御

高速応答、長文資料読み、画像説明、スキーマ修復を分けて、同じAUA report contractに正規化します。

言語フォールバック

JPでは日本語を第一言語にし、UI copy、prompt、report、chat、exportのfallbackも日本語で用意します。

Cognitive Engine

Persona-first response generation

AI国民は、都道府県、年齢、性別、職業、生活文脈、関心、資料、設問を読み、自分の条件に照らして回答します。 あらかじめ決めた支持率を理由で飾るのではなく、個別の判断を作ってから集計します。

Persona response contract
input = {
  brief,
  sourceContext,
  cohort,
  personaProfile,
  questions,
  answerContract
}

output = {
  supportScore,
  confidence,
  segmentLabel,
  quote,
  answers[],
  objections[],
  attractionDrivers[]
}

Survey Taxonomy

意向・態度

購入意向、利用意向、視聴意向、好意度、共有意向

加重平均top-box信頼帯driver model

政策・公共判断

政策賛否、公共施策、予算優先順位、地域課題

支持率セグメント比較反対理由抽出

候補・選択肢比較

ブランド名、商品案、パッケージ案、候補メッセージ

選択率ランキングスコア理由コード化

プロダクト機能・KANO

必須機能、魅力機能、不満要因、優先順位

KANO-lite重要度・満足度機能四象限

価格・収益化

月額、単発価格、無料体験、バンドル、価格抵抗

Van WestendorpGabor-GrangerWTP

メッセージ・リスク診断

誤解、反感、信頼障壁、危機対応コピー

topic clustering感情コード化代表quote

Statistics

記述統計

頻度、比率、加重平均、中央値、標準偏差、top-box/bottom-boxで基本分布を示します。

不確実性

有効標本数、近似信頼区間、bootstrap区間、希少strata警告を併記します。

集団差

t-test、ANOVA、Mann-Whitney U、Kruskal-Wallis、Cohen's dなどで集団差を見ます。

関連分析

chi-square、Cramer's V、相関、odds ratioで変数間の関連を説明します。

ドライバーモデル

high intentやsupportを目的変数にし、反応を左右する要因を整理します。

自由回答コード化

自由回答を反対理由、魅力、誤解、信頼条件、価格障壁などに分類します。

加重平均とshare
weighted_mean = sum(w_i * x_i) / sum(w_i)

weighted_share = sum(w_i * I(condition_i)) / sum(w_i)

top_box = P(response in {4, 5})
bottom_box = P(response in {1, 2})
有効標本数
n_eff = (sum(w_i)^2) / sum(w_i^2)

SE(p_hat) = sqrt(p_hat * (1 - p_hat) / n_eff)

CI_95 = p_hat +/- 1.96 * SE(p_hat)
関連指標
chi2 = sum((observed_ij - expected_ij)^2 / expected_ij)

Cramers_V = sqrt(chi2 / (n * min(r - 1, c - 1)))
尺度信頼性
alpha = (k / (k - 1)) *
  (1 - sum(var(item_j)) / var(total_score))

item_total_corr = corr(item_j, total_score_without_j)

Sampling

Cohort normalization

都道府県、年齢帯、性別、就業、家族、住居、関心領域をAuaCohortSpecに正規化します。

Weighted sampling

public facetとpopulationWeightを使い、誰に聞くかを決めます。この段階では回答を生成しません。

Coverage warning

条件に合うsource personaが不足するときは警告を出し、希少strataの解釈を慎重にします。

Private response rows

個別回答はprivate response storeに残し、公開レポートは集計値と代表引用を中心に見せます。

Report Pipeline

01

個別回答

AI国民ごとのanswers、quote、objectionsを保存します。

02

集計

加重平均、top-box、segment contrast、driverを計算します。

03

Markdownレポート

日本語の要約、方法、注意書き、次のactionを生成します。

04

成果物

回答表、CSV/JSONL、PDF、レポート用スライドプロンプトへ展開します。

Persona Chat

72-hour session

完了runの個別回答を根拠に、72時間のフォローアップチャットを開きます。

Grounded in response

quote、answers、objections、attractionDriversを読み、同じAI国民の文脈として会話します。

Not aggregate statistics

チャットは定性的な深掘りです。そこから出た発言を全体統計へ自動昇格しません。

Recommended use

反対理由を掘る、価格条件を詰める、次の設問案を作る用途に向いています。

Core Functions

buildAuaReportAsync(args)

lib/persona-engine.ts

対象条件、質問、資料文脈、persona sampleを受け取り、JP report contractに沿って実行を開始します。

generatePersonaResponses(...)

lib/persona-engine.ts

AI国民をchunkに分け、個別回答を並列生成します。日本語promptとJP segment labelを使います。

normalizeLlmPersonaResponse(...)

lib/persona-engine.ts

モデル出力のscore、confidence、answers、quote、objections、driversを検証し、レポート行へ正規化します。

estimateCohort(...)

lib/cohort-facets.ts

public-safe facetをもとに対象条件の推定母集団、警告、計算根拠を返します。

buildAuaCitizenId(...)

lib/aua-citizen-id.ts

`AUA-JP-00000001-001` 形式を生成し、国コード付きIDポリシーを担います。

resolvePersonaAvatarUrl(...)

lib/aua-avatar-server.ts

country、sex、ageBand、persona uuidから決定的にアバターを選びます。

API Contracts

Citizen IDポリシー
type AuaCitizenId = "AUA-{COUNTRY}-{sourceSeq8}-{replicaSeq3}";

// JP canonical example
"AUA-JP-00000001-001"
Run source context
type AuaSourceContext = {
  material?: string;
  assetSummaries?: string[];
  assetIds?: string[];
  webLinks?: string[];
};
Persona回答row
type AuaPersonaResponse = {
  personaUuid: "AUA-JP-00000001-001";
  citizenId: "AUA-JP-00000001-001";
  regionLabel: string;
  segmentLabel: string;
  populationWeight: number;
  supportScore: number;
  confidence: number;
  answers: Array<{ questionId: string; value: number | string | string[]; reason: string }>;
  quote: string;
  objections: string[];
  attractionDrivers: string[];
};
Full run作成
POST /api/projects/:id/runs

{
  "brief": AuaBrief,
  "cohort": AuaCohortSpec,
  "questions": AuaQuestion[],
  "sampleSize": 2000,
  "sourceContext": {
    "material": "日本語の入力資料",
    "assetIds": ["asset-id-001"],
    "webLinks": ["https://..."]
  }
}

Data Sources

AUA Japanのsource layerはNemotron Japanと日本公式統計を基準にします。下記はP2-P7で使う主要参照先です。 AUA Japanが各機関の公式統計プロダクトであるという意味ではありません。

Licenses

データセット出典表示

NVIDIA Nemotron-Personas-Japan データセット出典およびライセンス

本プロジェクトはNVIDIAのnvidia/Nemotron-Personas-Japanデータセットを使用します。同データセットはCC BY 4.0ライセンスで提供され、適切な出典表示を条件に共有、改変、再配布、商用利用が可能です。

データセット
nvidia/Nemotron-Personas-Japan
提供者
NVIDIA
ライセンス
Creative Commons Attribution 4.0 International (CC BY 4.0)
変更事項
AUA Japanの合成AI回答者ソース、標本抽出、統計補正、リサーチ回答生成の文脈で利用します。
注意
本プロジェクトはNVIDIAの公式製品、保証、後援、代理運用物ではありません。