Need authorization agreement

20-newsgroups

The 20 Newsgroups data set

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

## Reference: * http://qwone.com/~jason/20Newsgroups/

データとリソース

追加情報

フィールド
ソース http://qwone.com/~jason/20Newsgroups/
最終更新 10月 11, 2020, 12:13 (CST)
作成日 3月 7, 2018, 16:43 (CST)

推薦資料集:


  • 110年3月高雄市外人地權管理報表

    Payment instrument Free
    Update frequency Irregular
    3月高雄市外人地權管理報表
  • 107年1月至6月花蓮縣違章漏稅案件處理及財務罰鍰執行情形2-2

    Payment instrument Free
    Update frequency Irregular
    違章漏稅案件處理及財務罰鍰執行情形
  • 雪山隧道自動化科技執法系統設置地點

    Payment instrument Free
    Update frequency Irregular
    提供國道公路警察局雪山隧道自動化科技執法系統置地點。(包含偵測超速、超低速、任意變換車道、未保持行車安全距離等項)
  • 水利署蝦蟹貝類調查資料

    Payment instrument Free
    Update frequency Irregular
    本資料集主要包含調查所在的流域、河川、樣點、日期、物種、使用方法以及數量。本資料集係由水利署水利規劃試驗所河川情勢調查資料庫管理系統所提供,彙整統合水利署歷年所完成之河川情勢資料,為河川情勢調查資料統一之管理及查詢網站。期盼作為河川水資源管理,生態環境維護、及對河川區域構造物辦理環境改善規劃需求時之參考資料。本資料集內容關鍵在於蝦蟹貝類物種、位置、時間...
  • 國有林堰塞湖資訊

    Payment instrument Free
    Update frequency Irregular
    提供資料包括:序號、堰塞湖名稱、發生日期、事件、縣市、鄉鎮、X、Y、權屬事業區、目前狀況、狀態、備註、更新日期等欄位資料。