
source row loading
AI国民プロフィール
loading random source row
AI国民プロフィールカードを読み込み中...
AUA Japan 技術文書

source row loading
loading random source row
AI国民プロフィールカードを読み込み中...
AUA Japanは単純な翻訳版ではありません。日本語UI、日本の公開統計、Nemotron Japan source persona、JP向けprompt、レポート、DOC、法務ドラフトを ひとつの国別adapterとして分離します。メインコピーは `1億人のAI国民が答える` ですが、技術的には100万source personaを公式統計で加重して読む設計です。
JP校正sourceレジストリ
ここでは完成済みの精度を主張しません。P7では下記6つの一次公開調査を基準に、同じ設問、近い選択肢、近い対象条件を使い、日本の公開調査とAUA JapanのAI国民回答を比較します。 close、mild gap、outlierを分け、数字が近いかだけでなく、選択肢順位、セグメント方向、自由回答の理由コードも確認します。
日本公開調査のsource候補値を整理し、AUA実行値は未実行として分けます。
Nemotron Japan 100万source personaを実行母体として扱います。
1億件のLLM callやDB rowではなく、加重母集団として説明します。
正式調査の代替ではなく、仮説を磨くリハーサルとして読ませます。
生活不安
内閣府 · 2024 · 日頃の生活の中で、悩みや不安を感じている/どちらかといえば感じていると答えた者
悩みや不安を感じているのはどのようなことについてですか。
AUA設問ドラフト
日頃の生活の中で悩みや不安を感じるとしたら、主にどのようなことについてですか。
上位項目の順位、各項目share、理由コードを比較する。全人口比ではなくscreened respondent比として扱う。
AUA実行待ち
性別役割観
内閣府 男女共同参画局 · 2024 · 全国18歳以上の日本国籍を有する者
「夫は外で働き、妻は家庭を守るべきである」という考え方について、どう考えるか。
AUA設問ドラフト
「夫は外で働き、妻は家庭を守るべきである」という考え方について、あなたはどう思いますか。
賛成/反対の小計、年齢別方向、反対理由の上位コードを比較する。
AUA実行待ち
デジタル生活
総務省 · 2024 · 世帯主が20歳以上の世帯、および6歳以上の世帯構成員
世帯・個人におけるスマートフォン保有状況。
AUA設問ドラフト
あなたの世帯ではスマートフォンを保有していますか。また、あなた自身はスマートフォンを保有していますか。
世帯保有率90.5%をprimary anchor、個人保有80%超をdirectional anchorとして扱う。
AUA実行待ち
結婚意向
国立社会保障・人口問題研究所 · 2021 · 18-34歳の未婚者
未婚者の生涯の結婚意思。
AUA設問ドラフト
あなたは、いずれ結婚するつもりですか。
男女別shareを別々に比較し、maritalStatus近似による母集団差を明記する。
AUA実行待ち
余暇・文化
総務省統計局 · 2021 · 日本に住む10歳以上
過去1年間の自由時間等における主な活動の行動者率。
AUA設問ドラフト
過去1年間に、趣味・娯楽、スポーツ、旅行・行楽をしましたか。
活動カテゴリ別の行動者率と順位を比較する。時点差とコロナ影響をoutlier候補として扱う。
AUA実行待ち
住生活・生活程度
内閣府 · 2024 · 全国18歳以上
生活の程度は、世間一般から見て、どうか。
AUA設問ドラフト
あなたの生活の程度は、世間一般から見てどのあたりだと思いますか。
5-category distribution、middle category concentration、lower-side shareを比較する。
AUA実行待ち
AUA Japanは結論を出す装置ではありません。質問を磨き、反対理由を発見し、どのセグメントに正式調査を当てるべきかを決めるためのリハーサルです。
AI国民は実在の個人を複製したものではなく、公開統計と合成ペルソナから作るAI回答者です。
市場調査、世論調査、選挙予測、公的統計、専門的助言の代替として使わないでください。
価格急騰、災害、事件、流行、プラットフォーム変化の直後は、公開統計やsource personaとの時点差が大きくなります。
非常に狭いファン層、特定企業の顧客、直近購入者などは実データとの追加検証が必要です。
生成モデルの出力には誤り、偏り、JSON破損、表現の揺れがあり得ます。schema guardと再試行で抑えます。
数千件の回答行があっても合成回答です。数字は判断の練習信号であり、実測値ではありません。
クレジット単位
JP版でも単位は変えません。`1 MeatPie = AI国民 1人` と説明し、2,000人のrunは2,000 MeatPieとして扱います。
回答生成人数とcredit消費を直感的に一致させるための単位です。
新規利用者向けの初期付与やベータ期間の上限は、運用画面と告知に合わせて更新します。
正式な販売条件は未確定です。ベータ期間中は追加提供や制限を運営側で管理します。
`1億人のAI国民が答える`を中心に、質問入力、資料添付、Raw回答、レポート、フォローアップチャットまでの製品の流れを日本語で見せます。
対象条件、設問、AI国民人数、MeatPie、実行状況、完了レポート、エクスポートを日本語ユーザーの作業画面として維持します。
英語ラベルのサイドバー構造は残し、hover/active時のローカルラベルを日本語で表示します。AI国民プロフィールスライドも削除しません。
Markdownレポート、回答表、CSV/JSONL、PDF、`レポート用スライドプロンプト`、フォローアップチャットを日本語の成果物として扱います。
プロダクト運用map
INPUT
日本語の調査テーマ、PDF、画像、URL、対象条件を受け取る。
INTAKE
文書と画像をAI国民が読める短い日本語文脈へ圧縮する。
SAMPLE
JP public facetsとsource personaから対象者を抽出する。
ENGINE
support、confidence、answers、quote、objectionsを生成する。
REPORT
Markdown、回答表、CSV/JSONL、スライドプロンプト、チャットへ渡す。
実行時ノート
`nvidia/Nemotron-Personas-Japan` の100万行をsource personaとして読み込みます。uuid、persona、prefecture、region、area、sex、age、occupationなどをJP schemaへ変換します。
Nemotron由来の個別行はprivate source indexとして管理し、公開bundleには生のpersona全文を出しません。公開面には安全なcohort facetだけを出します。
e-Stat、総務省統計局、人口推計などの日本公式統計を使い、年齢、性別、都道府県、世帯、就業、住居、生活領域の重みを付けます。
LABの対象条件UIには、個人を推測できない集計済みfacetだけを渡します。JP master datasetのQA reportとdata dictionaryを別途残します。
JP master dataset成果物
P2からP4では、単にparquetを読み込むだけでなく、private source index、official weighted enrichment master、public-safe cohort facets、QA report、data dictionaryを作ります。
`AUA-{COUNTRY}-{sourceSeq8}-{replicaSeq3}` を共通ポリシーにし、JPでは `AUA-JP-00000001-001` を標準形にします。旧 `AUA-KR-*` はparse互換だけ残します。
実行は100万source personaを基準にします。`1億人`のコピーは、1億件の生成や1億行保存ではなく、公式統計で加重した解釈母集団です。
欠損、都道府県分布、年齢・性別分布、重みの極端値、公開facetの丸め、再現可能なseedを検査して、P2-P4の完了条件にします。
source column、normalized column、公開可否、利用UI、重み計算、prompt利用可否をまとめ、次の国へのスピンオフにも流用できる形式にします。
利用者の説明、政策案、商品紹介、キャンペーン文案を調査資料として整理し、日本語の判断文脈に圧縮します。
PDF、DOCX、TXT、MD、PNG、JPG、WEBPを受け取り、文書はMarkdown要約、画像は製品・場面・価格・コピーの日本語説明に変換します。
URL本文から必要な文脈だけを取り出し、AI国民が読む調査資料に混ぜます。リンク本文をそのまま長文投入しません。
完了runの資料要約はsource_contextとして残し、worker、report、follow-up chatが同じ根拠を参照できるようにします。
AUA Japanは、質問生成、資料要約、画像説明、AI国民回答、schema repair、レポート生成を同じ日本語product contractに正規化します。
設問、回答理由、反対理由、引用、セグメント名、レポート本文を日本語で生成し、他言語のfallbackが表に出ないようにします。
supportScore、confidence、segmentLabel、answers、quote、objections、attractionDriversを検証し、壊れたJSONは修復または再試行します。
高速応答、長文資料読み、画像説明、スキーマ修復を分けて、同じAUA report contractに正規化します。
JPでは日本語を第一言語にし、UI copy、prompt、report、chat、exportのfallbackも日本語で用意します。
AI国民は、都道府県、年齢、性別、職業、生活文脈、関心、資料、設問を読み、自分の条件に照らして回答します。 あらかじめ決めた支持率を理由で飾るのではなく、個別の判断を作ってから集計します。
input = {
brief,
sourceContext,
cohort,
personaProfile,
questions,
answerContract
}
output = {
supportScore,
confidence,
segmentLabel,
quote,
answers[],
objections[],
attractionDrivers[]
}購入意向、利用意向、視聴意向、好意度、共有意向
政策賛否、公共施策、予算優先順位、地域課題
ブランド名、商品案、パッケージ案、候補メッセージ
必須機能、魅力機能、不満要因、優先順位
月額、単発価格、無料体験、バンドル、価格抵抗
誤解、反感、信頼障壁、危機対応コピー
頻度、比率、加重平均、中央値、標準偏差、top-box/bottom-boxで基本分布を示します。
有効標本数、近似信頼区間、bootstrap区間、希少strata警告を併記します。
t-test、ANOVA、Mann-Whitney U、Kruskal-Wallis、Cohen's dなどで集団差を見ます。
chi-square、Cramer's V、相関、odds ratioで変数間の関連を説明します。
high intentやsupportを目的変数にし、反応を左右する要因を整理します。
自由回答を反対理由、魅力、誤解、信頼条件、価格障壁などに分類します。
weighted_mean = sum(w_i * x_i) / sum(w_i)
weighted_share = sum(w_i * I(condition_i)) / sum(w_i)
top_box = P(response in {4, 5})
bottom_box = P(response in {1, 2})n_eff = (sum(w_i)^2) / sum(w_i^2)
SE(p_hat) = sqrt(p_hat * (1 - p_hat) / n_eff)
CI_95 = p_hat +/- 1.96 * SE(p_hat)chi2 = sum((observed_ij - expected_ij)^2 / expected_ij)
Cramers_V = sqrt(chi2 / (n * min(r - 1, c - 1)))alpha = (k / (k - 1)) *
(1 - sum(var(item_j)) / var(total_score))
item_total_corr = corr(item_j, total_score_without_j)都道府県、年齢帯、性別、就業、家族、住居、関心領域をAuaCohortSpecに正規化します。
public facetとpopulationWeightを使い、誰に聞くかを決めます。この段階では回答を生成しません。
条件に合うsource personaが不足するときは警告を出し、希少strataの解釈を慎重にします。
個別回答はprivate response storeに残し、公開レポートは集計値と代表引用を中心に見せます。
AI国民ごとのanswers、quote、objectionsを保存します。
加重平均、top-box、segment contrast、driverを計算します。
日本語の要約、方法、注意書き、次のactionを生成します。
回答表、CSV/JSONL、PDF、レポート用スライドプロンプトへ展開します。
完了runの個別回答を根拠に、72時間のフォローアップチャットを開きます。
quote、answers、objections、attractionDriversを読み、同じAI国民の文脈として会話します。
チャットは定性的な深掘りです。そこから出た発言を全体統計へ自動昇格しません。
反対理由を掘る、価格条件を詰める、次の設問案を作る用途に向いています。
buildAuaReportAsync(args)
lib/persona-engine.ts
対象条件、質問、資料文脈、persona sampleを受け取り、JP report contractに沿って実行を開始します。
generatePersonaResponses(...)
lib/persona-engine.ts
AI国民をchunkに分け、個別回答を並列生成します。日本語promptとJP segment labelを使います。
normalizeLlmPersonaResponse(...)
lib/persona-engine.ts
モデル出力のscore、confidence、answers、quote、objections、driversを検証し、レポート行へ正規化します。
estimateCohort(...)
lib/cohort-facets.ts
public-safe facetをもとに対象条件の推定母集団、警告、計算根拠を返します。
buildAuaCitizenId(...)
lib/aua-citizen-id.ts
`AUA-JP-00000001-001` 形式を生成し、国コード付きIDポリシーを担います。
resolvePersonaAvatarUrl(...)
lib/aua-avatar-server.ts
country、sex、ageBand、persona uuidから決定的にアバターを選びます。
type AuaCitizenId = "AUA-{COUNTRY}-{sourceSeq8}-{replicaSeq3}";
// JP canonical example
"AUA-JP-00000001-001"type AuaSourceContext = {
material?: string;
assetSummaries?: string[];
assetIds?: string[];
webLinks?: string[];
};type AuaPersonaResponse = {
personaUuid: "AUA-JP-00000001-001";
citizenId: "AUA-JP-00000001-001";
regionLabel: string;
segmentLabel: string;
populationWeight: number;
supportScore: number;
confidence: number;
answers: Array<{ questionId: string; value: number | string | string[]; reason: string }>;
quote: string;
objections: string[];
attractionDrivers: string[];
};POST /api/projects/:id/runs
{
"brief": AuaBrief,
"cohort": AuaCohortSpec,
"questions": AuaQuestion[],
"sampleSize": 2000,
"sourceContext": {
"material": "日本語の入力資料",
"assetIds": ["asset-id-001"],
"webLinks": ["https://..."]
}
}AUA Japanのsource layerはNemotron Japanと日本公式統計を基準にします。下記はP2-P7で使う主要参照先です。 AUA Japanが各機関の公式統計プロダクトであるという意味ではありません。
データセット出典表示
本プロジェクトはNVIDIAのnvidia/Nemotron-Personas-Japanデータセットを使用します。同データセットはCC BY 4.0ライセンスで提供され、適切な出典表示を条件に共有、改変、再配布、商用利用が可能です。