빅데이터 (2) 썸네일형 리스트형 아파치 스파크 개요 1. 기본 개요 ㅁ. 스파크 머신 러닝 (스파크 MLlib 모듈) 스파크 MLlib 모듈은 여러 도메일을 아우를 수 있는 머신 러닝(Machine Learning) 기능을 제공한다. 스파크 웹 사이트에서 제공하는 문서를 보면 MLlib 모듈이 처리 가능한 데이터 타입(벡터와 LabelPoint 구조)를 소개한다.스파크 MLlib 모듈은 다음과 같은 기능을 제공한다. - 통계(Statistics) - 분류(Classification) - 회귀(Regression) - 협업 필터링(Collaborative Filtering) - 클러스터링(Clustering) - 차원 축소(Dimessionality Reduction) - 특징 추출(Feature Extraction) - 빈발 패턴 마이닝(Frequent .. PostgreSQL 이중화 방법 Feature Shared Disk Failover File System Replication Transaction Log Shipping Trigger-Based Master-Standby Replication Statement-Based Replication Middleware Most Common Implementation NAS DRBD / Pacemaker Streaming Repl. Slony pgpool-II Communication Method shared disk disk blocks WAL table rows SQL No special hardware required • • • • Allows multiple master servers • No master server overhead .. 이전 1 다음