분류 전체보기 38

하둡 이론

병렬 분산 알고리즘 사용이유 Scale-out 아주 많은 값싼 서버를 이용 Scale-up 적은 수의 값비싼 서버를 이용 데이터 중심 어플리케이션 분야에서는 아주 많은 값싼 서버를 많이 이용한다. 고가의 서버들은 가격에 관점에서는 선형으로 성능이 증가하지 않기 때문에 값싼 서버 여러개가 가격측면에서 좋다. 맵리듀스 프레임워크 데이터 중심 프로세싱 한대의 컴퓨터 능력으로 처리가 어렵다 수천대의 커뮤터를 묶어 처리해야한다 맵리듀스 프레임워크가 하는 것이 위 처리이다. 맵리듀스는 빅데이터를 이용한 효율적인 계산이 가능한 첫 번째 프로그래밍 모델 기존에 존재하는 여러 가지 다른 병렬 컴퓨팅 방법에서는 프로그래먹 낮은 레벨의 시스템 세부 내용까지 아주 잘 알고 많은 시간을 쏟아야만 함 빅데이터를 이용하는 응용분야..

하둡

하둡 **정의 : 빅데이터의 저장과 분석을 위한 분산 컴퓨팅 솔루션** **하둡 세분화** 빅데이터 : 한대의 컴퓨터로는 저장하거나 연산하기 어려운 규모의 거대 데이터 분산 : 여러대의 컴퓨터로 나눠서 일을 처리함. 저장 : 데이터를 저장한다. 분석 : 데이터가 저장된 컴퓨터에서 데이터를 분석하고 그 결과를 합친다. **사용이유** 정형 데이터는 RDBMS에서 저장가능하지만 비정형 데이터는 RDBMS에 저장하기 너무 큼 OpenSource 프로그램 **하둡에서 빅데이터** 3V : Volume, Velocity, Variety **volume** : 크기(tera, peta), **분산 컴퓨팅 솔루션** : hadoop, GFS,GreenPlum, Vertica, Netezza, Kickfire **ve..

프로그래머스_오픈채팅방/Using(Python_파이썬)

Problem https://programmers.co.kr/learn/courses/30/lessons/42888 코딩테스트 연습 - 오픈채팅방 오픈채팅방 카카오톡 오픈채팅방에서는 친구가 아닌 사람들과 대화를 할 수 있는데, 본래 닉네임이 아닌 가상의 닉네임을 사용하여 채팅방에 들어갈 수 있다. 신입사원인 김크루는 카카오톡 오 programmers.co.kr About Problem 문제 1. 사람들이 들어왔는지 나갔는지 닉네임을 변경했는지 구분하기 2. 들어왔을때, "[닉네임]님이 들어왔습니다." 나갔을때, "[닉네임]님이 나갔습니다." 순서대로 리스트에 넣기 3. 닉네임 변경 - 채팅방에서 닉네임을 변경하는 방법은 다음과 같이 두 가지이다. 채팅방을 나간 후, 새로운 닉네임으로 다시 들어간다. 채팅..

백준_2470_두용액/Using(Python/파이썬)

Problem https://www.acmicpc.net/problem/2470 2470번: 두 용액 첫째 줄에는 전체 용액의 수 N이 입력된다. N은 2 이상 100,000 이하이다. 둘째 줄에는 용액의 특성값을 나타내는 N개의 정수가 빈칸을 사이에 두고 주어진다. 이 수들은 모두 -1,000,000,000 이상 1,000,00 www.acmicpc.net About Problem 두 용액을 합하여 0에 가까운 수를 만드는 문제이다. input이 2이상 100,000 이므로 완전탐색은 할 수 없다. 정렬을 통해서 조건을 통해서 양끝을 줄여가면 빅오 N으로 값을 찾을 수 있다. 이 방식이 바로 two pointer다. 이 문제와 같이 two pointer는 두 값을 비교해서 특정 조건을 찾을 때 자주 쓰..

백준_10866_덱/Using(파이썬/Python)

Problem https://www.acmicpc.net/problem/10866 10866번: 덱 첫째 줄에 주어지는 명령의 수 N (1 ≤ N ≤ 10,000)이 주어진다. 둘째 줄부터 N개의 줄에는 명령이 하나씩 주어진다. 주어지는 정수는 1보다 크거나 같고, 100,000보다 작거나 같다. 문제에 나와있지 www.acmicpc.net About Problem 문제 그대로 deque를 구현을 하면된다. python은 collection 라이브러리에 deque모듈이 있기 때문에 구현이 쉽다. 시간 계산은 N이 100000이기 때문에 시간은 여유롭다. Code deque모듈의 함수를 쓰면 되기 때문에 주석을 보고 순서와 push만 판단하면 문제는 쉽다. from sys import stdin from ..