Introduction to Data Science II

Bill Howe’un dersi devam ediyor. Dersin contextinden bahsederken bazı güzel notlar sıralamış ve kendini kanıtlamış bazı data scientistlerden alıntılar yapmış. Kısaca bunlara bakalım:

drew_conway_venn_diagram

 

Drew Conway, Machine Learning’in bir adım öteye götürülebileceğini söylemiş. Verilerle uğraşmak aslında o kadar da kolay değil. Bu uğraş için pratik hacking yeteneği, iyi bir matematik ve istatistik bilgisi ve kısaca anlamlı ve süregelen bir uzmanlığa sahip olmak gerekiyor.

Peki LinkedIn‘de Chief Scientist olarak çalışan DJ Patil konuyla ilgili ne diyor?

Diyor ki, data scientist dediğimiz adamın aslında bilgisayar bilimleri altyapısından değil de, fizik ya da matematik gibi daha somut bir altyapıdan gelmesi gerektiği. Bunun sebebini de, altyapısında matematiksel bilimler olan bir insanın anlamlı veri yakalayabilmesi için çok daha fazla uğraşmasına, bu nedenle big picture dediğimiz bakış açısına odaklanmasına bağlıyor.

Mike Driscoll’a göre, data scientistleri şu üç önemli yeteneğe sahip olmalı: Statistics, Data Munging and Visualization. Statistics ve Visualization maddelerinin anlamları gayet açık. Data Munging ise elindeki veriyle oynayabilme yeteneği. Bill Howe’un slaytlarına göre kısaca parsing, scraping, formatting data diye gidiyor. Benim de şu üç madde arasından en çok hoşlandığım şey bu data munging, hatta bit.ly‘nin chief scientisti Hilary Mason’ın eşanlamlı kullandığı üzere data wrangling ya da data jujitsu. Bu iş iyi kotarılırsa, elde edilecek verinin görselleştirilmesinin inanılmaz bir zevk vereceği kanaatindeyim.

Leave a Reply