Miért számít az adattudomány?

Az adatalapú vállalkozások felépítésével foglalkozó sorozatunk első szakaszában megosztottuk az adat-alapú vállalkozás felépítéséhez szükséges legfontosabb összetevőket: különös hangsúlyt fektetünk a hatásokra és az adat-alapú kultúra felépítését. Ebben a második üzenetben arra összpontosítunk, hogy miért fontos az adattudomány, és megvitatjuk az adattudomány jövőjét az építési termékekkel összefüggésben.

Pontosan mi az adattudomány? Az adattudomány egy tudományos és igazságkereső tudományág, amely az adatokat felhasználja az ismeretek és betekintések kinyerésére. Az adattudomány az egyik leggyorsabban növekvő funkció, és már óriási értéket képvisel minden iparágban és a tanulmányi területeken. Ennek ellenére az adattudomány még mindig gyerekcipőben jár, és mint minden fejlődő terület, gyakran kísértésnek tűnik határokat meghatározni a meghatározása körül. Ahelyett, hogy kategorizálnánk azt, ami adattudománynak számít, vagy nem, vagy azzal vitatkozunk, hogy miért kell az adatokkal kapcsolatos, de nem adatközpontúnak lennünk, véleményünk szerint a legfontosabb, hogy teret hagyjunk a tudományágnak a szerves fejlődéséhez.

MIÉRT AZ ADATTUDOMÁNY?

A technológiai vállalat indítása, a jó termék felépítése és a vonzás megszerzése könnyebbé vált a jobb csatlakoztathatóság, a csökkenő felhőtárolási és számítási költségek, valamint a célközönség eléréséhez szükséges terjesztési platformok hozzáférhetőségének köszönhetően. Ennek eredményeként a termék 100 millió havi aktív felhasználó eléréséhez szükséges idő drámaian lerövidült, és ma is csökken. Például kb. 100 hónap telt el ahhoz, hogy az iTunes elérje a 100 millió havi aktív felhasználót 2003-ban, és csupán néhány nap alatt a Pokemon Go ugyanezt tette. Az alábbi táblázat néhány jó példát tartalmaz, kezdve a telefonnal.

A több beépített termék, az Internethez csatlakoztatottabb eszközök vásárlása és a megnövekedett online időtartam együttesen növekedést okozott a felhasználói interakciós adatok mennyiségében. Óriási érdeklődés mutatkozik ezen adatok bányászása és a legfontosabb betekintés készítése érdekében, hogy előállítsuk a nagyszerű termékeket. A vállalat versenyképességét most azt mérik, hogy mennyire sikeresen alkalmazza az elemzést hatalmas, strukturálatlan adatkészletekre, különféle forrásokból, a termékinnováció előmozdítása érdekében. Ezért az adattudósoknak nagy a keresletük, és az intelligens adattudósok egy csoportja elkészítheti vagy elbonthatja a terméket.

A bányászati ​​adatok iránti növekvő érdeklődés arra késztette a termékcsoportokat, hogy az adatok felhasználásával négy konkrét eredményre összpontosítsanak.

  1. A vállalkozás egészségi állapotának értékelése: A termék-elemzés egyik legfontosabb eredménye egy termék vagy vállalkozás állapotának felmérése. Miután a termék sikerét egy cél és egy metrika segítségével meghatároztuk, a következő lépés a mutató figyelemmel kísérése annak biztosítása érdekében, hogy a cél elérése felé haladunk. Taktikailag az elemzők az eltérések azonosításán, a metrikák változásainak mozgatórugóinak megértésén, műszerfalak / jelentések / megjelenítések készítésén stb.
  2. A megfelelő termékek és szolgáltatások szállítása: Az elemzés másik nagyon fontos szerepe a megfelelő termékek és szolgáltatások építésének biztosítása. Sok vállalat végez számos kísérletet és szállít termékeket, miután értékelte a kísérletek eredményeit. Az adattudósok általában segítenek a kísérletek megtervezésében, az adatokra alapozott jelenségekkel kapcsolatos hipotézisek azonosításában és az adatok betekintésén keresztül vezetik a termékcsoportot a termék folyamatos optimalizálásához.
  3. Előrejelzés és energiatermelési rendszerek - Az adattudósok másik szerepe prototípusok / modellek és energiatermelő rendszerek felépítése AI / ML segítségével. Ezek az adattudósok egy jelenség gépi tanulási modelljeit képzik a jövőbeli várakozások és trendek előrejelzése céljából.
  4. Állítsa be a termék ütemtervét és stratégiáját: A felhasználói út és a jelenségek mélyebb feltárása és elemzése gyakorlati betekintést nyer, amely végső soron a termék ütemtervének és stratégiájának meghatározását eredményezi. Az adatközpontú ütemterv és stratégia a világszínvonalú termék-elemző csoport egyik legfontosabb eredménye.

Ez a négy eredmény kifejezetten az adattudósok két különféle típusához vezetett az iparban - termékanalitikusokhoz és algoritmusfejlesztőkhöz.

MI AZ ADATTUDOMÁNYOK?

Az adattudós címe több szerepet foglal magában, amelyek jelentősen különböznek a vállalatok és az iparágak között. Általában véve két fő tudományos tábor van:

  1. Termékanalitikusok, akiknek az a szerepe, hogy adat-informált történeteket bocsássanak rendelkezésre, amelyek támogatják a termék vagy stratégia megváltoztatását. Például, az SMS értesítési kézbesítő rendszer Indiában megszakadt. Ennek eredményeként az SMS-értesítések javítására kell összpontosítanunk Indiában, amely elősegíti a növekedés újbóli érvényesülését.
  2. Algoritmusfejlesztők, akiknek szerepe az adatközpontú szolgáltatások beépítése a termékekbe (például az ajánlások vagy a keresési eredmények optimalizálása). Például. A csalások mértéke Indonéziában megnőtt. Készítsen egy új modellt, amely a közelmúltbeli csalások trendjére összpontosít Indonéziában.

A termék-elemzők a célok kitűzésére, valamint a termék-ütemtervek és stratégiák tájékoztatására összpontosítanak. Elősegítik a termékek fejlesztését az egészségük felbecsülése és megértése, valamint a termékekkel kapcsolatos döntések meghozatala révén (nagyrészt kísérletezés útján). A termék-elemzőktől általánosan elérhető dokumentum egy termékcsapatnak szóló dokumentum, amely számszerűsíthető kérdéseket, azonosított lehetőségeket, valamint adat-alapú ajánlásokat és megoldásokat ismertet.

Az algoritmusfejlesztők elsődleges feladata az adatok kiaknázása a termék teljesítményének javítása érdekében, egy adott végcél elérése érdekében, általában az eredmények előrejelzése vagy a termelési rendszerek építése céljából. Az algoritmusfejlesztők általában gépi tanulást és más összetett algoritmikus technikákat használnak előrejelzések készítéséhez hatalmas mennyiségű adatból származó bemenetek alapján. Általánosságban az algoritmusfejlesztők prototípusként javasolt megoldásokat dolgoznak ki, és szorosan együttműködnek a mérnökökkel a gyártásban történő megvalósításuk érdekében. Az algoritmusfejlesztők által szállított prototípus kód és dokumentáció, amelyet a mérnöki csapat rendelkezésére bocsátanak.

Míg mindkét típusú tudósnak analitikai kilátásokra, kvantitatív készségekre és prioritási képességre van szüksége, ritka olyan ember megtalálása, aki mindkét szerepre képes. Az algoritmusfejlesztők kifinomultabb műszaki ismereteket igényelnek, például gépi tanulást és mesterséges intelligenciát, valamint a mérnökökhöz közeli szintű szoftverfejlesztési ismereteket igényelnek. A termék-elemzők elsősorban olyan problémamegoldók, akik üzleti, termékük és képességük alapján különbséget tesznek az érdekeltek széles köre között.

Míg csak néhány szervezet igényel algoritmusfejlesztőt, minden vállalat - különösen a jelentős felhasználói bázissal rendelkezők - részesül előnyben a termékanalitikusoktól, akik segítenek navigálni a termékben, a versenyképességben és más stratégiai kihívásokban. Később ebben a blogbejegyzés-sorozatban további útmutatásokat nyújtunk a termék-elemzők felvételéhez, képzéséhez, coachingához és menedzsmentjéhez, hogy a legmagasabb szintű hozzájárulást nyújtsák.

Tehát, a vállalatoknak algoritmusfejlesztőket kell felvenniük, és jobban adatközpontúaknak kell lenniük, vagy termékanalitikusokat kell felvenniük, és jobban adatinformációkat kell alkalmazniuk? Az eredmények pusztán adatközpontúak, ha az adatok az egyetlen jel, amelyre a döntéshez szükség van. Ezzel szemben az adatokra alapozott döntéseknél az adatok erőteljes bemenet, de nem az egyetlen bemenet. Általánosságban elmondható, hogy a termék-elemzők adatokkal vannak informálva, az algoritmusfejlesztők pedig adatvezérelt.

AZ ADATTUDOMÁNY FOLYAMATA

Képzeljünk el egy olyan világot, amelyben egy gép mindent tud rólad, és vásárolhat Önnek anélkül, hogy kifejezetten megkérne; ismeri a kívánt ételt és főz Önnek; ismeri a választásait, és döntéseket hozhat érted, és tudja, mi jót jelent neked, és megtervezi az életét. Ez a világ távoli a jövőbe, és mesterséges intelligenciát igényel, hogy átvegye életünk nagy részét. Ahhoz, hogy haladhassunk az álom felé, még adatközpontúbbá kell válnunk.

Egy tökéletes világban, tökéletes információkkal és a rendszer összes mozgatórugójának, valamint az egymással való interakciójának teljes megértésével, a két megközelítés összefonódik. A tökéletes modell felépítéséhez a vizsgált jelenséget teljes mértékben meg kell érteni; az adatok és a jelenség közötti kapcsolatot egy tökéletes modell (és a hozzá tartozó gazdag funkciók halmaza) írhatja le. Annak érdekében, hogy erre a tökéletességi szintre fejlődhessünk, és közben is előrelépést lehessen elérni, a világnak tovább kell haladnia az adatokra alapozott döntéshozatalban. azaz tovább kell bővítenünk döntéshozatalunkat más szubjektív intézkedésekkel, amelyeket még nem lehet teljes mértékben számszerűsíteni. Amint elkezdjük mélyebben megérteni az objektumok közötti kapcsolatokat, egyre több folyamat automatizálódik, és a jövő inkább adatvezérelt, mint adatinformált. Az adatokra alapozott döntéshozatal azonban továbbra is rendkívül fontos a következő néhány évtizedben, és az adatközpontú döntéshozatal csak az adatokkal tájékozott emberek előrehaladásával javul.

A leginkább szemlélteti példák segítségével az adatokra alapozott döntéshozatal és az adatvezérelt döntéshozatal közötti különbségek megértését.

  • Célokat kitüzni. A jó célok mérhetők és számszerűsíthetők. A célok azonosításának és nyomon követésének képessége egyre inkább adatközpontú lesz. Például a Facebook aktív felhasználóinak nyomon követése talán teljesen automatizált. A megfelelő negyedéves és éves célok meghatározása azonban az aktív felhasználók és a bevételek szempontjából valószínűleg csak részben automatizált, és továbbra is az adatokkal kapcsolatos információk lesznek.
  • Útiterv és stratégia meghatározása. Az ütemterv és a stratégia kidolgozása nem mennyiségi, ezért adat-alapú megközelítést igényel. Például adatok felhasználásával útitervet lehet kidolgozni az aktív napi használat fokozására az SMS értesítésre összpontosítva. Egy jó ütemterv figyelembe veszi a releváns célokat, e célok mozgatórugóit, a termékcsapat rendelkezésére álló eszközöket, valamint az összes megtehető cselekvési irányt. Ennek nagy része minőségi, tehát az ütemterv kidolgozásának és a stratégia meghatározásának folyamata elsősorban az adatokkal kapcsolatos.
  • Előrejelző eredmények. Az előrejelzési eredmények többnyire adatközpontúak. Például annak kiderítése, hogy egy történet megmutatása legyen-e a felhasználónak, több tényező megértését igényli, beleértve annak valószínűségét, hogy a felhasználó rákattint vagy elolvassa a történetet. A vállalatok általában olyan modelleket dolgoznak ki, amelyeket folyamatosan iterálnak, hogy előre jelezzék ezt a konkrét eredményt.
  • Erőteljes termelési rendszerek. Az olyan vállalkozások számára, mint a PayPal, amelyek bármely tranzakció csalárd tevékenységeit azonosítják, túlságosan költséges, hogy ezt manuálisan végezzék el az összes tranzakciónál. Ennek eredményeként nagyrészt a gépi tanulásra támaszkodnak, hogy táplálják termelési rendszereiket, és automatizálják a tranzakciók rossz valószínűségének kiszámítását. A valószínűség értékelését követő döntéshozatal nagy része szintén automatizált. Azonban azokon a területeken, ahol alacsonyabb a bizalom a valószínűségi értékelésekben, a döntéshozatali folyamat adatainak alapjául szolgálhat.

elvitelre

  • A termékek fejlesztése és az adatok révén történő pénzszerzés az elmúlt években versenyelőnyré vált. Az erős és jól szervezett adatszervezet erős megkülönböztetőt jelent.
  • Az adattudósok vezetik a kulcsfontosságú termékekkel kapcsolatos döntéseket a vállalatok között, és a következő generációs algoritmusokat készítik a döntéshozatal javítása érdekében.
  • A világ továbbra is egyre inkább adatközpontú lesz, ám az adatokra alapozott döntéshozatal továbbra is releváns.

Ez a munka a Sequoia Capital Data Science csapata eredménye. Chandra Narayanan, Hem Wadhar és Ahry Jeon írta ezt a posztot. Lásd a teljes tudományos sorozatot itt. Kérdésekkel, megjegyzésekkel és egyéb visszajelzésekkel kérjük, írjon e-mailt a data-science@sequoiacap.com címre.

Ezt a történetet a The Startup, a Medium legnagyobb vállalkozási kiadványában tették közzé, amelyet +432 678 ember követ.

Feliratkozás, hogy itt kaphassa a legfontosabb történeteket.