본문 바로가기
  • Let's go grab a data
반응형

Data97

TensorFlow Mac 설치, jupyter Notebook 설치 TensorFlow Mac 설치, jupyter Notebook 설치 [python 설치]터미널을 열어서 python -V 를 해보면 2.7버전이 설치되어 있음 1. 설치파일 다운로드https://www.python.org/downloads/Mac OS X 선택 후 다운로드 및 설치 2. Install Now 클릭하여 설치 3. 설치 완료 확인은 cmd창을 열어서 > python -V 하면 Python 2.7.x 라고 나타남. 왜? 설치는 3.x 버전으로 했는데? >python3.6 -V 으로 해보면Python 3.6.x로 나타남. 즉 2버전과 3버전이 모두 설치되어 있는 상태 하나로 python으로 사용하고 싶으면 ~/.bash_profile 를 수정해서 alias하여 사용하면 됨 4. vi 편집기로 .. 2017. 12. 10.
Tensorflow Object Detection API _ CentOS7 설치 Tensorflow Object Detection API _ CentOS7 설치https://github.com/tensorflow/models/blob/master/object_detection/g3doc/installation.md [패키지 다운로드]# yum install protobuf-compiler# pip install Pillow --proxy http://PROXYIP:PROXYPORT --trusted-host pypi.python.org 또는 #>pip3.6 install Pillow# pip install lxml --proxy http://PROXYIP:PROXYPORT --trusted-host pypi.python.org# pip install matplotlib --proxy.. 2017. 8. 18.
인포그래픽Infographic 왜 인포그래픽인가?- 한 이미지 안에 복합적인 정보를 모은다는 것은 이미지만 단독으로 확산 하는 SNS와 웹상에서의 정보 전달에 적합하다. 인포그래픽의 조건1) 의미있는 시각 요소를 이용하는 것2) 간결하고 친근하며 알기 쉬운 것3) 힘을 주고 눈길을 끄는 것4) 내용에 가치가 있고 자료로 보존해두고 싶은 것5) 보는 사람에게 생각할 계기를 주는 것 데이터시각화와의 차이?인포그래픽과 데이터의 정리 정돈과 활동은 비슷하지만 데이터 해석 부터는 전문가가 아닌 사람이 접해도 이해할 수 있도록디자인해야 하는 것이 다르다. 집적된 데이터를 사람이 이해하기 쉬운 형태로 가공하고 비교적 디자이너의 관여가 크다.데이터 시각화의 목적은 더 광범위해 인포그래픽을 포함한다 인포그래픽에 적합한 내용1) 시의성 : 시기를 알려.. 2017. 7. 24.
데이터의 질 - intra-/inter-class variability 데이터의 질 - intra-/inter-class variability 데이터의 질에 따라 머신러닝을 통한 분석의 결과가 바뀐다 Intra- 클래스 내부의 분산이 어떤가Inter- 클래스간 분산이 어떠냐 위 이미지에서 위쪽 줄은 Intra-class variability가 작다 아래 줄은 크다왼쪽 두 산점도는 Inter-class variability가 크다 오른쪽 두 산점도는 작다 그래서 inter-가 크고 intra-가 작은 Input으로 만들어주는 것이 좋다= 클래스 별로 잘 구분되는 것이 좋고 클래스 내부에 서로 뭉쳐있는 것이 좋다 예) 성적을 예측하라X: 키, 몸무게, 사교육, IQ, 소득, 형제, 이성친구, 인터넷 사용시간, 게임 시간, 소비금액, 등등 high dimension - 다 때려 .. 2017. 7. 20.
인포그래픽Infographic _ Diagram 다이어그램 - 단순한 도형과 짧은 글로 어떤 상황을 설명하는 그래픽 다이어그램은 언제 쓰는가? - 글만 있으면 인상에 남지 않는다 - 글만 있으면 너무 설명적이다 - 정리 정돈된 설명을 할 수 없다. 픽토그램과의 유사점 전하고 싶은 대상의 본질을 파악해 일을 단순화 픽토그램과의 차이점 픽토그램이 순간을 포착하는 것이라면, 다이어그램은 상황의 흐름이라는 시간축이나 상호관계 등의 스토리텔링 가능 다이어그램을 만들 때 필요한 것 해석 능력 - 정보 가운데 신뢰성 높은 것을 추출해 각각의 관련성을 끌어 내는 것 편집 능력 - 주제를 설정하고 조리있게 전달하려면 어떻게 해야 좋을지 생각 인포그래픽과 다이어그램의 차이점 다이어그램은 인포그래픽의 원형, 다이어그램을 가공하면 인포그래픽이 된다 차이점은 상대에게 전달하.. 2017. 6. 16.
인포그래픽Infographic _ Pictogram 인포그래픽 - 정보를 알기 쉽게 다른 사람에게 전하는 형태로 시각화 한것 시각화의 이유는 직관적인 커뮤니케이션비주얼은 강력한 정보전달 도구이자 언어만으로 불충분한 커뮤니케이션을 보충인포그래픽은 시각화 중에 특히 정보전달 기능 특화 인포그래픽의 목적시각적인 힘으로 연결관계가 명확해지고 새로운 가치를 발견할 수 있다.정보의 지도픽토그램과 다이어그램의 조합 픽토그램: 언어를 대신하거나 보완하는 그래픽공간, 시간, 언어를 초월해 정보의 본질을 단순하게 함화장실 표시 등 그래프와 조합된 픽토그램 (범례에 활용되거나 막대그래프 자체를 픽토그램으로 쌓아올려 표현한다) 픽토그램 활용1. 아이콘, 그림 문자등 목적에 따라 다르게 표현된다2. 군더더기를 뺀 디자인3. 키스해링, 줄리안오피 등 예술가는 픽토그램처럼 단순한 .. 2017. 6. 13.
[통계학 Talk]공분산Covariance과 상관계수Correlation [통계학 Talk]공분산Covariance과 상관계수Correlation 확률값에 따른 분포 즉, 확률변수 X를 가장 잘 나타내는 것은평균, 분산평균은 분포의 중간 위치를 알아내는 것이고분산은 분포가 얼마나 퍼져있는지 알아내는 것 왜 공분산이 필요한가?확률변수가 2개일때는각 평균을 구해보면 얼마나 가까운지 알 수있다그런데 두개의 분포가 얼마나 퍼져있는지? 두 확률변수가 어떻게 퍼져있는지 나타내는 것은공분산Covariance 즉, 두 확률변수 X가 커지면 Y도 커지는지, 혹은 작아지는지, 혹은 상관이 없는지 알려주는 지표 공분산의 특성공분산이 >0 양의 상관관계 - X가 커지면 Y도 커진다공분산이 2017. 6. 13.
순환신경망 RNN (Recurrent Neural Network) 순환신경망 RNN (Recurrent Neural Network) 일반적인 신경망은 각각의 입출력이 서로 독립적이라 가정하지만 RNN은 순서가 있는 정보를 입력 데이터로 사용한다는 점이 특징예를 들어 문장에서 다음에 올 단어를 예측할 시 이전 단어와 연관이 있기 때문이다. 음성인식, 음악, 문자열, 동영상등 순차적인 정보가 담긴 데이터를 다룰 수 있다.모든 입력 시퀀스에 대해 동일한 연산을 수행하지만 연산 시점에서의 출력 데이터는 이전의 모든 연산에 영향을 받는 특성이 있다. 업데이트 상태 벡터 Updated State Vector : 시퀀스에 대한 모든 과거 개체들에 대한 정보를 담음위 그림의 우측 구조는 각 시간 스텝에 대한 전체 입력 시퀀스를 처리하기 위한 네트워크로써각 계층마다 다른 매개변수(가중.. 2017. 6. 9.
합성곱신경망 CNN (Convolutional Neural Network) 합성곱신경망 CNN (Convolutional Neural Network) 신경망으로 구성된 딥러닝 유형으로 특히 이미지의 사물 인식 분야, 음성 인식 분야에서 각광 받음컬러 이미지와 같은 다차원 배열로 이루어진 데이터 처리 가능 (입력이 2차원)일반적인 신경망은 이미지 데이터 그대로 처리하지만, CNN은 이미지에서 특징을 추출해 처리함 CNN의 단계지역 수용 영역Local receptive fields -> 합성곱 Convolution -> 풀링 pooling CNN의 특징 및 가정지역 연결성Local connectivity 2차원 데이터의 일부분이 다른 부분과 연관성이 있을 수 있다고 가정함 지역 수용 영역 단계 : 첫 번째 레이어의 영역에 해당하는 뉴런은 다음 레이어의 하나의 뉴런으로 표현됨지역 연.. 2017. 6. 2.
반응형