2018년 3월 28일 수요일

빅데이터 언어(R, Python, Hadoop)


R, Python 및 Hadoop을 배우는 21 가지 이유 (위의 원문을 번역 정리한 내용임)
당신이 빅 데이터 전문가, 데이터 과학자를 꿈꾸면 R, Python, Hadoop 알아야 한다.
WHY R?
  1. 데이터 과학자는 코딩 능력,  통계학 전공 지식이 필요하며 통계학자가 통계 프로그래밍 언어 중 표준인 R을 쉽게 배울 수 있다.
  2. R은 오픈 소스이며 무료로 사용할 수 있다. SAS, Matlab과 달리 자유롭게 R을 설치, 사용, 업데이트, 복제, 수정, 재배포 및 재판매 할 수 있고 통계 프로그래밍 언어에 유용한 쉬운 업그레이드도 가능하다. 
  3. R은 플랫폼 간 호환이 가능합니다. R은 Windows, Mac OS X 및 Linux에서 실행할 수 있다. 또한 Microsoft Excel, Microsoft Access, MySQL, SQLite, Oracle 및 기타 프로그램에서 데이터를 가져올 수 있다.
  4. R은 강력한 스크립(프로그래밍)팅 언어로 크고 복잡한 데이터 세트를 처리 할 수 있으며, 대용량, 자원 집약적  시뮬레이션이 가능하고 고성능 컴퓨터 클러스터로 사용할 수 있습니다. 
  5. R은 사용자가 급속히 증가하고 매우 유연하고 발전했다. 새로운 통계 방법론의 함수, 패키지가 빠르게 업로드 된다. 
  6. R은 분석 결과(그래프 포함)를 워드 프로세싱 문서에 삽입 가능하다. 연구 논문의 그래프도 R 이 출판 가능 수준의 품질을 제공한다. 
  7. R은 정기적으로 토론 포럼, 온라인 글로벌 커뮤니티 - 거대하고 활발한 커뮤니티 및 리소스 뱅크 를 보유하고 있다. 현재 2,000 개의 통계분석을 위한 무료 라이브러리가 제공되고 있다. 

WHY Python?
R보다 배우기 쉽고 웹 및 게임 개발자들 사이에서 선호되는 고급 프로그래밍 언어이다.
  1. Python은 배우기 쉽다. Python 프로그램은 코드 가독성 높고, 간단한 구문 및 구현 용이성, 사용자 친화적이다. 
  2. Python은 짧은 코드로 디버그하기 쉽다.  
  3. Python은 널리 사용되고 있다. Python은 Google의 검색 엔진, YouTube, DropBox, Reddit, Quora, Disqus 및 FriendFeed를 지원한다. 
  4. Python도 R과 같은 객체 지향 언어입니다. Python 기초를 이해하면 새로운 언어의 구문을 배우기 만하면되므로 다른 객체 지향 언어로 마이그레이션이 가능하다. 
  5. Python은 오픈 소스이고 단순성은 매력적이다. 
  6. Python은 고성능 언어로 비즈니스에 필수적인 고속 응용 프로그램을 구축하기 위한 언어로 오랫동안 사용되고 있다.
  7. Python은 Rasberry Pi(영국 개발 초소형 PC)에서 사용가능하다.

WHY Hadoop? 
  1. Hadoop은 R 및 Python과 마찬가지로 오픈 소스이다. 
  2. Hadoop은 방대한 양의 데이터를 쉽게 저장하고 처리 할 수 있어 고객의 시대에 필요한 유연한 미래의 데이터 플랫폼의 초석으로 강력하다.
  3. Hadoop은 다양한 기능을 제공 : 데이터웨어 하우징, 예측 분석, 데이터 검색 및 ETL(추출-변환-부하)에도 사용된다. 
  4. Hadoop은 다양한 역할 : Hadoop Architects, Hadoop 개발자, 데이터 과학자 또는 관리자로 일할 수 있다. 
  5. Hadoop은 Big Data 시장에서 가장 많이 찾는 기술 중 하나이며, 인증 된 Hadoop 개발자의 연봉은 매우 높다. 
  6. 하둡은 미래 지향적 도구, 건강한 미래를 가지고 있다.  
  7. Hadoop 사용은 다국적 기업에서 증가 : 델, 아마존 웹 서비스, IBM, 야후, 마이크로 소프트, 구글, 이베이, 오라클과 같은 상위 기업들은 Hadoop 언어에 의존하고 있다.