ერთი დღე მონაცემთა მეცნიერის ცხოვრებაში

BrainStation-ის მონაცემთა მეცნიერის კარიერის სახელმძღვანელო დაგეხმარებათ გადადგათ პირველი ნაბიჯები მომგებიანი კარიერისკენ მონაცემთა მეცნიერებაში. წაიკითხეთ მიმოხილვა, თუ როგორ ატარებენ მონაცემთა მეცნიერები სამუშაო დღეებს.

გახდი მონაცემთა მეცნიერი

ესაუბრეთ სწავლის მრჩეველს, რომ გაიგოთ მეტი იმის შესახებ, თუ როგორ დაგეხმარებათ ჩვენი ჩატვირთვის კურსები გახდეთ მონაცემთა მეცნიერი.



გაგზავნის დაწკაპუნებით თქვენ ეთანხმებით ჩვენს Ვადები .



გაგზავნა

გაგზავნა ვერ მოხერხდა! განაახლოთ გვერდი და სცადოთ ხელახლა?

შეიტყვეთ მეტი ჩვენი Data Science Bootcamp-ის შესახებ

Გმადლობთ!

მალე დაგიკავშირდებით.



მონაცემთა მეცნიერების Bootcamp გვერდის ნახვა

ერთი დღე მონაცემთა მეცნიერის ცხოვრებაში

Brainstation-ის ციფრული უნარების გამოკითხვაში შესწავლილი ყველა დისციპლინიდან, მონაცემთა მეცნიერება შეიძლება მოიცავდეს აპლიკაციების ყველაზე ფართო სპექტრს. მაგრამ მიუხედავად იმისა, რომ მონაცემთა მეცნიერება ათწლეულების განმავლობაში არსებობს, ის მხოლოდ ახლახანს აყვავდა. როდესაც მონაცემთა ხელმისაწვდომობა გაფართოვდა, კომპანიებმა გააცნობიერეს, თუ რამდენად მნიშვნელოვანი შეიძლება იყოს მონაცემთა მეცნიერება, ამბობს ბრაანა ბრაუნელი, Pure Strategy-ის დამფუძნებელი და აღმასრულებელი დირექტორი და მონაცემთა მეცნიერი 13 წლის განმავლობაში. ახლა ყველა კომპანიას სჭირდება ნაწილობრივი ფოკუსირება ტექნოლოგიაზე. მხოლოდ ამ კვირაში, მაგალითად, მაკდონალდსმა გადაიხადა დაახლოებით 300 მილიონი აშშ დოლარი, რათა შეეძინა თავისი დიდი მონაცემთა ფირმა.

ამიტომ გასაკვირი არ არის, რომ მონაცემთა მეცნიერთა კონკურენცია წარმოუდგენლად მაღალია. სულ რაღაც ორ წელიწადში მოთხოვნა 28 პროცენტით გაიზრდება, რაც დაახლოებით 2.7 მილიონი ახალი სამუშაო ადგილის ექვივალენტურია. ეს უფრო მეტი ადგილია, ვიდრე ახალი კურსდამთავრებულები შეძლებენ შეავსონ - რაც ნიშნავს, რომ ტექნიკური მუშაკებს სხვა სფეროებში მოუწევთ თავიანთი უნარების ამაღლება და მონაცემებზე გადასვლა ამ მოთხოვნის დასაკმაყოფილებლად.

სინამდვილეში, ჩვენი გამოკითხვა გვიჩვენებს, რომ ეს უკვე ხდება. მონაცემთა ხუთიდან დაახლოებით ოთხმა თავისი კარიერა დაიწყო სხვა რამის კეთებით და მონაცემთა მეცნიერთა 65 პროცენტი მუშაობდა ამ სფეროში ხუთი ან ნაკლები წლის განმავლობაში. ახალი გონების ამ უზარმაზარ ნაკადს ორმხრივი ეფექტი აქვს, ამბობს ბრაუნელი; ერთის მხრივ, ბევრი ახალი იდეა შემოდის, ამბობს ის. როდესაც ვუყურებ ზოგიერთ შინაარსს, რომელიც გამოდის მონაცემთა მეცნიერების საზოგადოებაში, მიკვირს, რამდენად დიდია ინოვაცია. თუმცა, უკანა მხარე არის ბორბლის ხელახლა გამოგონების ტენდენცია.



მონაცემთა მეცნიერებზე მაღალი მოთხოვნა დიდია, თუ თქვენ ხართ ერთი (ან ფიქრობთ გახდეთ), მაგრამ დამსაქმებლებისთვის დაქირავება შეიძლება იყოს საშინელი გამოწვევა. აქ ხელახალი კვალიფიკაცია აშკარა გამოსავალია; შესაძლოა უფრო ეფექტური იყოს ამჟამინდელი თანამშრომლის გადამზადება მონაცემთა მეცნიერებაში, ვიდრე ახლის ძიება.

მაგრამ მაშინაც კი, თუ თქვენ გეგმავთ მონაცემთა მეცნიერების ახალი გუნდის დაქირავებას, თქვენს ორგანიზაციას, როგორც მთლიანს, შეიძლება დასჭირდეს მონაცემთა წიგნიერების გაუმჯობესება, გვაფრთხილებს ბრაუნელი. ყველას სურს იმუშაოს იმაზე, რაც გავლენას მოახდენს მათ სამუშაო ადგილზე, რაც აუმჯობესებს ადამიანების ცხოვრებას, ამბობს ის. თუ თქვენი კომპანიის კულტურა არ არის ისეთი, რომ [თქვენს მონაცემთა მეცნიერებს] გავლენა მოახდინონ, დაქირავება თითქმის შეუძლებელია. ხელმძღვანელობას უნდა შეეძლოს არა მხოლოდ პოტენციურ დაქირავებულებთან კომუნიკაცია, თუ როგორ შეძლებენ მათ წვლილი შეიტანონ, არამედ გაიაზრონ წინადადებები, რომლებსაც მათი მონაცემთა მეცნიერების გუნდი საბოლოოდ წამოაყენებს.

სამწუხაროდ, ბრაუნელი ამბობს, რომ არასასიამოვნო უმრავლესობა ის კომპანიებია, რომლებმაც ვერ გაარკვიეს. ჩვენი გამოკითხვა ადასტურებს ამას: რესპონდენტთა უმეტესობამ (52 პროცენტი) აღწერს მონაცემთა წიგნიერების დონეს თავიანთ ორგანიზაციებში, როგორც საბაზისო, ხოლო შემდეგი ყველაზე გავრცელებული პასუხი შუალედურია (31 პროცენტი). ეს ვარაუდობს, რომ მონაცემთა მეცნიერების ზოგიერთი ძირითადი ტრენინგი შეიძლება სასარგებლო იყოს კომპანიების დიდი უმრავლესობისთვის, განსაკუთრებით ხელმძღვანელობაში.



მონაცემთა გაუმჯობესებული წიგნიერების და კომუნიკაციის ეს საჭიროება იზრდება იმით, თუ როგორ არის სტრუქტურირებული მონაცემთა მეცნიერების უმეტესი გუნდი: როგორც დისკრეტული გუნდი, ჩვეულებრივ, 10 ან ნაკლები ადამიანისგან (რესპოდენტთა 71 პროცენტის მიხედვით), და ხშირად ხუთი ან ნაკლები (38 პროცენტი). ). ამ მჭიდროდ შეკრულ გუნდებს არ შეუძლიათ იზოლირება. პირები, რომლებიც მუშაობენ დიდ კომპანიებში, ჩვეულებრივ, არიან მონაცემთა მეცნიერების მცირე ჯგუფში, ხოლო მათი კლიენტები არიან შიდა - ორგანიზაციის სხვა ნაწილები, განმარტავს ბრაუნელი, ასე რომ, ეს არის გუნდი, რომელიც უნდა მოქმედებდეს ორგანიზაციის სხვადასხვა სფეროში.

რა არის ზუსტად მონაცემთა მეცნიერება?

ბრაუნელი ამბობს, რომ საერთო აღქმა (რომ მონაცემთა მეცნიერები ჭრიან ციფრებს) არც ისე შორს არის. არსებობს უამრავი მონაცემთა ნაკრები, რომლებსაც უნდა ჰქონდეთ მათგან გამოვლენილი შეხედულებები, და ეს მოიცავს უამრავ ნაბიჯს, როგორიცაა მოდელის შექმნა და მონაცემთა გასუფთავება, და მხოლოდ იმის გადაწყვეტას, თუ რა მონაცემები გჭირდებათ. თუმცა, საბოლოო ჯამში, ეს ძალისხმევა მიზანზეა ორიენტირებული: მის ძირითად არსში, თქვენ უნდა გააკეთოთ რაღაც მონაცემებით.

ამ მხრივ, მონაცემები ყოველთვის არ არის რიცხვები. მაშინ, როცა რესპონდენტთა უმრავლესობამ (73 პროცენტი) აღნიშნა, რომ მუშაობს ციფრულ მონაცემებთან, 61 პროცენტმა თქვა, რომ ასევე მუშაობს ტექსტთან, 44 პროცენტი სტრუქტურირებულ მონაცემებთან, 13 პროცენტი გამოსახულებით და 12 პროცენტი გრაფიკით (და მცირე უმცირესობები ვიდეო და აუდიოზეც კი მუშაობენ. — 6 პროცენტი და 4 პროცენტი შესაბამისად). ეს გამოკითხვის შედეგები მიუთითებს იმაზე, თუ როგორ ვრცელდება მონაცემთა მეცნიერება ფინანსური ცხრილების მიღმა, აწვდის ადამიანებს ისეთ პროექტებს, როგორიცაა მომხმარებელთა კმაყოფილების მაქსიმიზაცია ან სოციალური მედიის სახანძრო შლანგიდან ღირებული ინფორმაციის მოპოვება.

შედეგად, მონაცემთა მეცნიერების სფეროში უზარმაზარი მრავალფეროვნებაა, ამბობს ბრაუნელი. თითოეულ ინდუსტრიას აქვს საკუთარი შეხედულება იმის შესახებ, თუ რა ტიპის მონაცემებზე მუშაობენ მონაცემთა მეცნიერები, რა სახის შედეგებს ელოდებათ და როგორ ჯდება ეს მათი კომპანიის ხელმძღვანელობის სტრუქტურაში. თუმცა, ყველა შემთხვევაში, მიზანია გამოიყენოს მონაცემები, რათა დაეხმაროს კომპანიას უკეთესი გადაწყვეტილებების მიღებაში. ეს შეიძლება იყოს პროდუქტების გაუმჯობესება, ბაზრის გაგება, რომელშიც მათ სურთ შესვლა, მეტი მომხმარებლის შენარჩუნება, მათი სამუშაო ძალის გამოყენების გაგება, იმის გაგება, თუ როგორ უნდა დაიქირავონ კარგი - ყველა სახის სხვადასხვა რამ.

მონაცემთა მეცნიერების ვაკანსიები

ტექნოლოგიის ზოგიერთ სფეროში, გენერლისტი გახდომა შეიძლება იყოს თქვენი საუკეთესო ნაბიჯი - ეს ასე არ არის მონაცემთა მეცნიერებაში. დამსაქმებლები, როგორც წესი, ეძებენ თავიანთ ინდუსტრიაში სპეციალიზებულ უნარებს. იმის გამო, რომ მონაცემთა მეცნიერება მრავალფეროვან გემოვნებაშია, ჩვენი გამოკითხვა უფრო ღრმად შეისწავლა, შეისწავლა სამუშაოების ხუთი ძირითადი კატეგორია: მონაცემთა ანალიტიკოსი, მკვლევარი, ბიზნესის ანალიტიკოსი, მონაცემთა და ანალიტიკის მენეჯერი და სათანადო მონაცემთა მეცნიერი.

ყველა ამ სამუშაოს სათაურში, მონაცემთა ჩხუბი და გაწმენდა იკავებს დროის დიდ ნაწილს - მაგრამ რა მიზნით? ყველაზე ხშირად, მიზანია არსებული პლატფორმის, პროდუქტის ან სისტემის ოპტიმიზაცია (45 პროცენტი), ან ახლის განვითარება (42 პროცენტი). უფრო ღრმად ჩაღრმავებულმა აღმოვაჩინეთ, რომ არსებული გადაწყვეტილებების ოპტიმიზაცია ბიზნეს ანალიტიკოსებსა და მონაცემთა ანალიტიკოსებს ეკუთვნით, ხოლო ახალი გადაწყვეტილებების შემუშავება უფრო ხშირად მონაცემთა მეცნიერებსა და მკვლევარებს ეკისრებათ.

ტექნიკა, რომელსაც მონაცემთა მეცნიერები იყენებენ, ასევე განსხვავდება სპეციალობის მიხედვით. ხაზოვანი რეგრესია იყო საერთო ინსტრუმენტი ყველა კატეგორიაში, რომელსაც ციტირებდა გამოკითხულთა 54 პროცენტი, მაგრამ იყო რამდენიმე სიურპრიზი, როდესაც გადავხედეთ პროგრამულ უზრუნველყოფას, რომელსაც ხალხი იყენებს.

Excel - ეს მონაცემთა ნაკრების მანიპულირების ქარხანა - პრაქტიკულად ყველგან არის გავრცელებული, მოხსენიებულია ყველა რესპონდენტთა 81 პროცენტის მიერ და ყველაზე პოპულარული ინსტრუმენტი ყველა კატეგორიაში, გარდა მონაცემთა მეცნიერთა (რომლებიც ყველაზე ხშირად ეყრდნობიან პითონს - და ასევე მიუთითებს უფრო დიდი ინსტრუმენტების ნაკრები, ვიდრე სხვა კატეგორიები). ). რა ხდის Excel-ს ასე გარდაუვალს, თუნდაც 2019 წელს?

ის, რაც მე მიყვარს Excel-ში არის ის, თუ როგორ გაძლევთ საშუალებას ნახოთ მონაცემები და მიიღოთ ინტუიციური შეგრძნება მის მიმართ, განმარტა ბრაუნელმა. ჩვენ ასევე ვიყენებთ ბევრ პითონს და ამ შემთხვევაში, როდესაც თქვენ აკეთებთ ანალიტიკას მონაცემთა ფაილზე, ის იმალება; თუ თქვენ კონკრეტულად არ დაპროგრამებთ თქვენი კოდის ნაწილს, რათა განახორციელოთ ნედლეული მონაცემების ვიზუალიზაცია, რომელსაც თქვენ აანალიზებთ, თქვენ მას ვერ ხედავთ. ხოლო Excel-თან ერთად, ის თქვენს წინაშეა. ამას ბევრი უპირატესობა აქვს. ზოგჯერ შეგიძლიათ შეამჩნიოთ პრობლემები მონაცემთა ფაილთან დაკავშირებით. მე ვერ ვხედავ Excel-ის გაქრობას ანალიზისგან.

ამის თქმით, ჯერ კიდევ არსებობს ამ სფეროში გამოყენებული სხვა პროგრამების გრძელი სია - გასაკვირი არ არის მისი მრავალფეროვნების გათვალისწინებით. SQL (43 პროცენტი) და Python (26 პროცენტი) ლიდერობენ პოპულარობით, Tableau (23 პროცენტი), R (16 პროცენტი), Jupyter Notebooks (14 პროცენტი) და რამდენიმე სხვა აგროვებს მნიშვნელოვან რიცხვებს - რომ აღარაფერი ვთქვათ უზარმაზარზე. რესპონდენტთა 32 პროცენტი, რომელმაც მოიყვანა სხვა ინსტრუმენტები, თუნდაც ამ უკვე გრძელი სიის გათვალისწინებით.

რა არის მონაცემთა მეცნიერების მომავალი?

და ბოლოს, ჩვენ ვკითხეთ, რა ტენდენციები ჩამოაყალიბებს ციფრულ ლანდშაფტს მომდევნო ხუთიდან 10 წლის განმავლობაში. მანქანათმცოდნეობა და ხელოვნური ხელოვნური ინტელექტი - ორივეს აქვს აპლიკაციები მონაცემთა მეცნიერებაში - იყო აბსოლუტური განვითარებით, რასაც რესპონდენტები ელოდნენ, რომ ექნება ყველაზე დიდი გავლენა, შესაბამისად 80 პროცენტი და 79 პროცენტი. ეს მიუხედავად იმისა, რომ მათგან მეოთხედზე ნაკლები (23 პროცენტი) ამჟამად მუშაობს AI-ით.

ხელოვნურ ინტელექტს შეუძლია მონაცემთა მეცნიერების აბსოლუტურად გარდაქმნა, ადასტურებს ბრაუნელი, რომლის კომპანია ავითარებს AI პროდუქტებს. ეს ნამდვილად არის უკონტროლო სწავლის მეთოდების დიდება. ჩვენ მხოლოდ იმდენი დრო გვაქვს იმისათვის, რომ შევხედოთ ამ მონაცემთა ნაკრებებს, განსაკუთრებით დიდი, ძალიან რთულია ყველაფრის გაკეთება. ხელოვნური ინტელექტის ინსტრუმენტები დაგეხმარებათ გამოავლინოთ ის, რისი ძებნასაც, შესაძლოა, არც იფიქროთ. ჩვენ ეს ნამდვილად გვქონია.

სხვა ტენდენციები მონაცემთა მეცნიერები უახლოეს მომავალში დომინირებენ: ნივთების ინტერნეტი (51 პროცენტი), ბლოკჩეინი (50 პროცენტი) და ელექტრონული კომერცია (36 პროცენტი), გაძლიერებული რეალობა და ვირტუალური რეალობა (38 პროცენტი და 27 პროცენტი) და ხმაც კი. დაფუძნებული გამოცდილება (25 პროცენტი) - ყველა მნიშვნელოვანი ჩვენება და ყველა სფერო, სადაც მონაცემთა მეცნიერება შეიძლება კარგად იქნას გამოყენებული.