本網站保存個人在 Yahoo 知識+ 的歷史數據,原始資料集如下。

📦
Yahoo Answers Datapack 原始問題資料
📥 下載資料
👤
User Data 使用者統計資料
📥 下載資料

1. 核心問答資料 (yahoo-answer-datapack)

資料集中的 answer.jsonquestion.json 採用相同的 JSON 陣列格式。每一個物件代表一則完整的問答紀錄。

資料結構 (Schema)

以下為單一問答物件的欄位說明:

欄位名稱 (Key)類型說明範例
idString原始問題 ID (唯一值)"20120423000016KK02519"
categoryObject分類資訊{"name": "電玩與網路遊戲"}
titleString問題標題"賽爾號登入..."
detailString問題詳細描述"為什麼學校電腦..."
stateString問題狀態"REFERENCE", "SOLVED"
createdString建立時間"Apr 23, 2012 11:31:02 AM"
answerCountInteger該題總回答數6
userAnswerObject我的回答內容 (詳見下方){...}

回答物件結構 (userAnswer)

這是資料中最核心的部分,紀錄了本人的回答內容與互動數據。

欄位名稱類型說明
textString回答內文 (含換行符號)
isBestAnswerBoolean是否被選為最佳解答
voteCountInteger獲得票數
ratingsObject按讚統計 {"thumbsUp": 0, "thumbsDown": 0}

2. 使用者統計資料 (User Data)

位於路徑 Answers/User Data 1/data.json 的檔案,紀錄了帳號整體的生涯統計數據。

資料結構 (userInfo)

"userInfo": {
    "nickname": "某幻、",
    "level": 6,
    "points": 21476,
    "created": "Aug 28, 2007 8:23:12 AM",
    "totalAnswerCount": 1018,
    "bestAnswerCount": 379,
    "bestAnswerPercentage": 37,
    "starsReceived": 2
    // ...其他統計欄位
}
欄位名稱說明備註
nickname暱稱當時使用的顯示名稱
level知識等級最高等級為 7
points總點數
totalAnswerCount總回答數生涯累計回答次數
bestAnswerCount最佳解答數獲選最佳解答的次數
bestAnswerPercentage採用率 (%)最佳解答數 / 總回答數
created帳號建立日

⚠️ 授權與使用聲明 (License)

  1. 資料格式授權:本備份資料的整理結構、檔案格式與統計數據開放授權使用。
  2. 內容保留權利:不授權回答內容(text, detail)本身的著作權。
    • 問答內文的著作權仍歸屬於原作者。
    • 本資料集僅供學術研究、數位考古與個人瀏覽使用。
    • 在不侵害原作者著作權益,並標註出處之下,開放對資料集以任何形式進行利用。
  3. 免責聲明:本資料內容僅代表當時 (2007-2015) 的時空背景,不保證資訊的現時正確性。