Memo

데이터의 이해

  • 암묵지와 형식지의 상호작용 관계 : '공통화 -> 표출화 -> 연결화 -> 내면화'
  • 반정형 데이터 : 데이터 내부에 메타 데이터를 갖고 있으며 일반적으로 파일 형태로 저장됨
  • 지식 : 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물
  • Cinematch 시스템 : 넷플릭스에서 개발한 영화 추천 알고리즘

  • 데이터웨어하우스 특성 : 데이터의 주제 지향성, 데이터 통합, 데이터의 시계열성, 데이터의 비휘발성
  • 데이터마이닝 : 대용량 데이터에서 의미있는 정보를 추출하여 의사결정에 활용하는 기술
  • 딥러닝 : 다층구조 형태의 신경망을 바탕으로 하는 머신 러닝의 한 분야
  • 빅데이터 활용의 기본 3요소 : 데이터, 기술, 인력

데이터 분석 기획

  • 분석대상은 명확하지만 분석방식이 명확하지 않은 경우는 Solution에 해당
  • 정형 데이터 유형 : ERP, CRM, SCM 등 정보시스템
  • 반정형 데이터 유형 : 로그 데이터, 모바일 데이터, 센싱 데이터
  • 비정형 데이터 유형 : 영상, 음성, 문자 등
  • CRISP-DM 방법론 모델렝 단계에서 수행하는 태스크 : 모델링 기법 선택, 모델 테스트 계획 설계, 모델 작성, 모델 평가

  • '분석준비도'의 분석 데이터 진단 항목
    • 데이터 충분성, 신뢰성, 적시성, 비구조적 데이터 관리, 외부 데이터 활용체계, 기준 데이터 관리
  • 데이터 분석 준비 프레임워크 중 분석 업무 파악 영역
    • 발생한 사실 분석, 예측 분석, 시뮬레이션 분석, 최적화 분석, 분석 업무 정기적 개선