본문 바로가기
반응형

데이터 사이언스2

[Data Science]EDA란(1) 이번에는 본격적인 데이터 분석의 전처리 과정이라고도 할 수 있는 EDA에 대해서 한 번 알아봅시다. EDA의 정의 EDA(Exploratory Data Analysis) : 탐색적 데이터 분석 보통 EDA라는 약자로 부르는 이 과정은 본격적인 데이터 분석에 앞서서 현재 내가 가지고 있는 데이터를 다각적으로 관찰하고 탐색하는 모든 과정을 말합니다. 시각화를 해서 데이터의 분포를 살펴볼 수도 있고 결측치의 유무, 중복값의 유무, 이상치 등등 결과를 내기 위한 분석에 앞서서 데이터 그 자체의 탐색 및 점검 단계라고 보면 되겠습니다. EDA를 하는 이유 기본적인 이유는 추후에 진행할 데이터 분석에 있어 분석 결과에 도움이 되지 않는 것들을 미리 방지하고자 함입니다. EDA는 보통 데이터 수집 이후에 바로 진행하.. 2023. 6. 26.
[Data Science]데이터 사이언스란 이번 포스팅은 제목과 같이 데이터 사이언스에 대해서 한 번 얘기를 해볼까 합니다. Data Science(데이터 과학) 데이터 사이언스, 사실 제가 고등학생 때만 해도 점점 이런 인공지능과 관련된 분야의 얘기들이 들리기 시작했습니다. 현재에 와서는 대학에서도 많은 데이터 분야 전공이나 인공지능 관련 전공들이 신설되면서 확실히 현대 사회에서 가장 핫한 이슈들 중 하나임에는 다들 이견이 없으실 것 같습니다. 그렇다면 데이터 사이언스는 뭘까요? 직역하자면 자료 과학인데 과학은 과학인데 자료를 모아서 하는 과학인가? 뭔가 와닿지 않는 느낌인데요. 위키백과에 따르면 '데이터 마이닝(Data Mining)과 유사하게 정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세.. 2022. 11. 11.
반응형