
非本科系轉職軟體工程師指南
台灣這幾年對人才的想像似乎圍繞著這幾個詞彙: 跨領域人才、T型人才、協槓青年。隨著這個風潮,最常見的大約是各domain人才希望踏入資工領域,今年已經有不下十個朋友詢問我相關問題,所以整理了一些想法跟大家分享。現在想想… 其實最應該開設跨領域整合研究所的並不是法律系,而是資工系。 非本科系學生找工作的選擇 非本科系如果跨入資工領域,我想以後的發展方向可能必須先思考一輪,我不會說你必須先決定要走哪個…

台灣這幾年對人才的想像似乎圍繞著這幾個詞彙: 跨領域人才、T型人才、協槓青年。隨著這個風潮,最常見的大約是各domain人才希望踏入資工領域,今年已經有不下十個朋友詢問我相關問題,所以整理了一些想法跟大家分享。現在想想… 其實最應該開設跨領域整合研究所的並不是法律系,而是資工系。 非本科系學生找工作的選擇 非本科系如果跨入資工領域,我想以後的發展方向可能必須先思考一輪,我不會說你必須先決定要走哪個…
2017 ithome鐵人競賽:包含網路爬蟲、Pandas、自然語言處理、資訊檢索、機器學習等主題的30天文章索引。

總體來說,2017算是最有希望的一年,從暗不見天日、徬徨錯愕的預期未來中,漸漸看見了一絲曙光。這篇文章除了訴說自己掙扎著逃出苦海的心路歷程之外,主要是希望給予正在同條路上的夥伴們一些分享。 人吶總是這樣 總想把對方改變成自己 2017我做了什麼? 2017年01月 開啟出逃事務所之旅:進入資策會2017年02月 進入資科人的世界:修習蔡銘峰老師的資訊檢索課程2017年04月 開始自學Python:…

概述 在開始看這篇文章之前,非常建議大家先熟悉個別的技術: 非同步技術以及多執行緒網頁爬取技術。以下,我想針對「他們的差別」以及在「多執行緒的技術理解焦點」兩個部分進行簡單的說明。 more 首先,關注到他們的差別。所謂的非同步技術,指得是我們每發出一個requests都要等待server端的回應,而非同步技術可以充分利用這個等待時間,同時再發出其他requests,直到server成功回應時,才…

概述 在網頁的取得上,因為每次去要求server回傳html檔時,都要等待回應一段時間,此時client端(也就是你的電腦)其實是沒有在運算的,因此若能夠使用這段時間,發出其他要求,將可大大增加爬取的速度。不過,非同步技術的概念其實相當複雜,甚至牽涉到一些硬體的知識,比較主要的難點在於與「多執行續」的差異解釋,這裡就不多加解釋,有興趣可以自行google。 more 程式碼 在看這隻程式碼時,建議…
目標 概述一些我接觸過的一些套件,讓大家對爬蟲的「技術鍊」、以及「常見的問題及其解決方式」有基礎的了解。 動機 這篇文章主要是寫給剛開始學習Python爬蟲的初學者,由於自己剛開始學習這部分知識時,所有的套件名詞猶如雪片般飛來,有時會錯誤的理解一個套件的使用方式,有時則對某個套件期待過高,學成時總覺得不過爾爾,有種失落感。因此著述。more 本篇文章的「爬蟲」 為了避免概念混淆,先打個預防針,我接…
Introduction Due to facebook api’s change on its query string. The built-in connecting system to facebook has some error. Unlike google authencation, you only have to input the ClientId, ClientSecret …
Introduction At first, I try to use mlab built-in backup system. However, it’s not include in its free 500mb program. As a result, I wrote a C# program to back up by myself.more Use cmd to backup mlab…
What is Word2vec? There are some keywords about the model for you to consider: unsupervised learning, LSTM, encode(translate) a word to a vector. Actually, I don’t know exactly about the theory of wor…
Function From scikit-learn: This is the loss function used in (multinomial) logistic regression and extensions of it such as neural networks, defined as the negative log-likelihood of the true labels …