資料科學網站大補帖!

最近跟一些資料科學的同好交流,有些朋友問我相關的資訊都是從哪裡得知,想必對於這方面有興趣卻又苦於找資源的朋友應該也有相關的需求。所以這篇文章分享我經常瀏覽的資料科學網站和FB社團,當我需要找尋靈感、吸收知識或閒來無事隨便看看時,以下就是我的一些名單。當然有更多的資源也歡迎跟我交流!(此篇分享的是單純的網站,如果要搜尋的是更多的線上課程,可以看看資料科學領域線上課程大彙整

取得資料

要培養對各式各樣不同領域資料科學敏銳度的第一步就是要看過、試過、玩過夠多樣化的資料,同時也是真的要動手的第一步。

  • Kaggle: 這大概是資料科學領域最知名的競賽網站之一了,個人習慣時不時瀏覽有哪些新的競賽、或是需要找尋靈感的時候瀏覽,並不論結束與否選擇自己較感興趣的幾個專案來深入了解與嘗試。同時思考除了競賽公布的預期結果之外,能用同樣的資料有什麼其他的結果,透過這樣的思考訓練自己在資料有限的情形下定義問題的能力。當然,如果能真的實地參加競賽絕對會非常有收獲!
  • Data.world: 這是一個開源的資料分享平台,主要的網站規劃就是提供任何人分享收集到的資料,同時可以在上面交流意見,雖然這個網站還在preview的版本,但裡面已經有非常多的資料分享了,另外,它提供了不同領域分類的功能,包含生醫、教育、運動等等的多元分類。
  • 政府開放資料平台: 台灣有著全世界開放資料揭露程度第一名的政府,當然不能放過這樣的資源!裡面有各式各樣以政府為角度的資料。對於看太多商業或是自己熟習領域的朋友,能夠有一個用不同角度看不同資料的機會。

吸收資料科學新知

對於分析方法的學習、觀摩其他人的成果或是新資訊的取得等等,是讓自己保持高度彈性的不二法門,以下是經常瀏覽的資料科學網站。

  • AnalyticsVidhya: 這是我最常瀏覽的網站,各式各樣的分類,讓我方便的檢視各個想要的內容,從教學、討論、新聞、分享都有非常完整的瀏覽路徑,同時更新的頻率與速度也非常高。
  • KDnuggets: 同樣擁有各式各樣豐富的資料科學內容,但是因為網站設計規劃稍微單調,所以個人相對比較少點閱,但想多吸收一點資訊的時候仍然非常的實用。
  • Medium.com: 一個包羅萬象的數位媒體,每個人都可以在這個平台上創建自己的自媒體,因此有許多優秀的資料科學家會在上面發布一些文章,也是我非常常使用的網站!例如Airbnb就在Medium上面有自己的資料科學頁面
  • R Bloggers: R語言在統計、機器學習及資料科學領域擁有極大的重要性,而這個網站有很多實作的文章、新library的資訊、課程等等,網站中應有盡有,當我想看看別人的實作或搜尋新的library時,也非常的有幫助!
  • 還有很多口袋中的網站,如下列出: 機器之心Data Science Central Quora

解決問題與發問

在實作的同時絕對不可能一帆風順,因此有可以發問與搜尋問題的管道是非常重要的。

  • Stack Overflow: 這應該不陌生,任何寫程式遇到的問題都可以在上面找到相關的解決方法。
  • Cross Validated: 這個網站對於實作過資料科學專案的朋友應該也很常見,和Stack Overfolw基本上並無二致,唯一的差別只是這個網站更聚焦在統計、資料分析、機器學習等等的問題。

基本上發問的管道就以這兩個為大宗,我也沒有私藏的名單,重點還是在如何Google到真的是自己想要知道且真的有幫助的問題(這其實沒有想像中的簡單)。

 

科技趨勢與商業新知

對我而言,看看新科技趨勢、創新應用、商業新知,一直都是我的興趣之一,而要成為一個專業的資料科學家,這些世界的脈動也是非常重要的,畢竟如果只空有理論或技術,卻對新的商業需求改變沒有相對應的對策,是沒辦法真正把分析結果實際應用在企業的。

這些專注在網路產業、創新創業或科技趨勢的媒體是我吸收產業趨勢新知的管道,這些網站都有FB的粉絲專頁,打開FB就可以看到各式各樣的文章非常方便,許多相對比較不是聚焦在產業趨勢的媒體,也是我每天瀏覽的來源,例如:天下雜誌、經理人、商業周刊、換日線、CNN、Bloomberg、Havard Business Review等等。原則上我個人的想法是,既然我無法控制每天拿起手機打開電腦就想滑FB的惡習,我就試著讓我的FB內容多一點養分,讓這個沒辦法改掉的惡習反過來變成我吸收新東西的來源。(當然前提是不能因為這樣反而就戒掉滑FB了啦!)

Facebook社團

上文提到我利用FB當作獲取訊息的來源,當然也有非常多社團可以得到資料科學的新知的!

  • Data Mining / Machine Learning / AI
  • 台灣資料科學同好交流區
  • Big Data, Data Science, Data Mining& Statistics
  • 大數據與數位決策(Big Data & Digital Decision)

這些是我的個人頁面中出現排名最高的幾個社團,同時也是我需要搜尋問題、了解新訊息等等的重要來源!(這裡我就不一一列出超連結了,有興趣的話FB直接搜尋社團名稱都可以找到)

另外分享一個我常用的FB功能,當我看到有興趣的文章當下沒有時間看、或是看完後覺得值得再看的文章我會用FB的“儲存”功能,只要按下每個貼文右上角的小箭頭,之後就可以輕易的重新瀏覽這些被儲存的連結!

忘與記的哲學

在資訊爆炸的年代,我們害怕的不是得到資訊,反而是資訊太多來不及吸收,或多到根本漏掉很多原本該吸收的內容。這樣的體會讓我想起在讀《倚天屠龍記》一書中張三丰教張無忌太極拳的一段內文:『張三丰晚年悟出太極拳,開關出來,卻不幸遭少林僧人空相以奸計偷襲得手,重傷嘔血,無法與趙敏手下之武林高手過招,只好將太極拳當場傳授給徒孫明教教主張無忌,由張無忌代為出場。過了一會兒,張無忌說:徒兒不才,已經忘記一小半了。張三丰不但不責怪,反而面露喜色,讚道:真是難能可貴,小小年紀就有此悟性。之後,張無忌又說:徒兒已經忘了一大半了。又過了一會,張無忌說:徒兒只剩三招沒忘。這時張無忌的屬下,都為教主擔心,心想:「待會兒就要過招了,結果教主只記得三招,如何是好?」最後,張無忌向張三丰說,徒兒已經全忘了。張三丰說:那你可以下場了。結果張無忌將太極拳發揮的淋漓盡緻,大勝對方。』

代表著舊時代的人物張三丰、新時代的象徵張無忌與代表著資訊爆炸的太極拳法,其實有些類似現在的我們,只要看過的內容夠多夠扎實後,其實會不經意的內化成我們的思想,而過去需要閉關修煉以悟出道理的方法似乎已經不適合快速變遷的現代。對我而言,我認為只要不停下吸收的腳步,即使很多內容只是瀏覽過,時間久了,同樣會累積成自己的能力吧!

至少我是這麼告訴自己的。

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s

Create a website or blog at WordPress.com

向上 ↑

%d 位部落客按了讚: