하둡 **정의 : 빅데이터의 저장과 분석을 위한 분산 컴퓨팅 솔루션** **하둡 세분화** 빅데이터 : 한대의 컴퓨터로는 저장하거나 연산하기 어려운 규모의 거대 데이터 분산 : 여러대의 컴퓨터로 나눠서 일을 처리함. 저장 : 데이터를 저장한다. 분석 : 데이터가 저장된 컴퓨터에서 데이터를 분석하고 그 결과를 합친다. **사용이유** 정형 데이터는 RDBMS에서 저장가능하지만 비정형 데이터는 RDBMS에 저장하기 너무 큼 OpenSource 프로그램 **하둡에서 빅데이터** 3V : Volume, Velocity, Variety **volume** : 크기(tera, peta), **분산 컴퓨팅 솔루션** : hadoop, GFS,GreenPlum, Vertica, Netezza, Kickfire **ve..