本網站保存個人在 Yahoo 知識+ 的歷史數據,原始資料集如下。
1. 核心問答資料 (yahoo-answer-datapack)
資料集中的 answer.json 與 question.json 採用相同的 JSON 陣列格式。每一個物件代表一則完整的問答紀錄。
資料結構 (Schema)
以下為單一問答物件的欄位說明:
| 欄位名稱 (Key) | 類型 | 說明 | 範例 |
|---|---|---|---|
id | String | 原始問題 ID (唯一值) | "20120423000016KK02519" |
category | Object | 分類資訊 | {"name": "電玩與網路遊戲"} |
title | String | 問題標題 | "賽爾號登入..." |
detail | String | 問題詳細描述 | "為什麼學校電腦..." |
state | String | 問題狀態 | "REFERENCE", "SOLVED" |
created | String | 建立時間 | "Apr 23, 2012 11:31:02 AM" |
answerCount | Integer | 該題總回答數 | 6 |
userAnswer | Object | 我的回答內容 (詳見下方) | {...} |
回答物件結構 (userAnswer)
這是資料中最核心的部分,紀錄了本人的回答內容與互動數據。
| 欄位名稱 | 類型 | 說明 |
|---|---|---|
text | String | 回答內文 (含換行符號) |
isBestAnswer | Boolean | 是否被選為最佳解答 |
voteCount | Integer | 獲得票數 |
ratings | Object | 按讚統計 {"thumbsUp": 0, "thumbsDown": 0} |
2. 使用者統計資料 (User Data)
位於路徑 Answers/User Data 1/data.json 的檔案,紀錄了帳號整體的生涯統計數據。
資料結構 (userInfo)
"userInfo": {
"nickname": "某幻、",
"level": 6,
"points": 21476,
"created": "Aug 28, 2007 8:23:12 AM",
"totalAnswerCount": 1018,
"bestAnswerCount": 379,
"bestAnswerPercentage": 37,
"starsReceived": 2
// ...其他統計欄位
}
| 欄位名稱 | 說明 | 備註 |
|---|---|---|
nickname | 暱稱 | 當時使用的顯示名稱 |
level | 知識等級 | 最高等級為 7 |
points | 總點數 | |
totalAnswerCount | 總回答數 | 生涯累計回答次數 |
bestAnswerCount | 最佳解答數 | 獲選最佳解答的次數 |
bestAnswerPercentage | 採用率 (%) | 最佳解答數 / 總回答數 |
created | 帳號建立日 |
⚠️ 授權與使用聲明 (License)
- 資料格式授權:本備份資料的整理結構、檔案格式與統計數據開放授權使用。
- 內容保留權利:不授權回答內容(text, detail)本身的著作權。
- 問答內文的著作權仍歸屬於原作者。
- 本資料集僅供學術研究、數位考古與個人瀏覽使用。
- 在不侵害原作者著作權益,並標註出處之下,開放對資料集以任何形式進行利用。
- 免責聲明:本資料內容僅代表當時 (2007-2015) 的時空背景,不保證資訊的現時正確性。