Introduction to Data Science презентация

What is Data Science? We have a lot of data. Math + Programming + Heuristics No strict mathematical models work well Extracting knowledge and conclusions straight from

Слайд 1Introduction to Data Science.


Слайд 2What is Data Science?
We have a lot of data.

Math +

Programming + Heuristics

No strict mathematical models work well

Extracting knowledge and conclusions straight from data no matter what.



Слайд 3By the way, You already did it.
Labs are the most common

case of the simplest Data Science.

Слайд 4Web search
Whole universe of barely structured data

Ranking pages for a

given query, collecting statistics, structuring data-all pure data Science/Engineering tasks.

Average Internet user Googles ~3-4 times per day.(There are ~two billions of us)

Слайд 5Recommendations
All kinds of context advertising

Recommended channels (YouTube)

Recommended playlists (VK,Yandex,Spotify)

Basket recommendations (Avito,Amazon)



Слайд 6Want to be a true scientist?
Then be it!
EEG, MRI(МРТ) decoding, NeuroInterfaces.

Telescope,

Microscope, Satellite images analysis.

CERN/LHC computations.






Слайд 7Or looking for corporative career?



Слайд 8Data Driven Art
Style transfer (Prisma, Artisto)





Images/Music synthesis


Слайд 9And Visualization.









Space-time visualization of mobile phone data in Dubai


Слайд 10Polite locals


Слайд 11Data Scientist: The Sexiest Job of the 21st Century


Слайд 21Как сделать лучше?
Внимательно
посмотреть на
данные

Расстояние:


Слайд 22Нормализация признаков



Слайд 23Нормализация признаков



Слайд 24

Почему равномерно взвешенный 2NN всегда не лучше чем 1NN?


Слайд 25если класс второго ближайшего соседа совпадает с классом первого, ответ алгоритма

не меняется
если класс второго ближайшего соседа не совпадает с классом первого, возникает неопределенность и алгоритм не дает никакого ответа.

Почему равномерно взвешенный 2NN всегда не лучше чем 1NN?


Слайд 28KNN summary
Для классификации каждого из объектов тестовой выборки необходимо последовательно выполнить

следующие операции:

Вычислить расстояние до каждого из объектов обучающей выборки
Отобрать k объектов обучающей выборки, расстояние до которых минимально
Класс классифицируемого объекта — это класс, наиболее часто встречающийся среди k ближайших соседей


Слайд 34

Как сделать лучше?
Внимательно
посмотреть на
данные





Ошибки предсказаний смещены относительно нуля


Слайд 35

Поправленные оценки


Слайд 37Data Science Entry-Level skillset
English language - must have
Google-fu - advanced
Linear

algebra & Calculus - basics
Statistics - common sense is almost enough
Programming - comfortable with Python or R


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика