본문 바로가기
  • Let's go grab a data
반응형

전체 글435

윈도우에서 웹 크롤링 Windows Web Crawling 환경설정 Python과 pip은 설치되어 있음 가상환경 설정C:\>pip install virtaulenv virtualenvwrapper C:\>virtualenv NAME아래 가상환경 진입C:\NAME\Scripts>activate.bat아래 가상환경 나가기(NAME) C:\NAME\Scripts>deactivate.bat virtualenv 만들 때 setuptools, pip, wheel을 다운로드 받는데 Proxy등 문제로 안될 경우 pip download --no-cache --proxy http://PROXYSERVER:PORT --trusted-host pypi.python.org setuptools wheel pipvirtualenv --no-download --extra-search-dir /o.. 2018. 12. 3.
사이다 경제 _ 사이다 경제 채권 - 이자소득, 자본 소득이자소득은 채권 발행 시 정한 이율에 따라 받는 것자본 소득은 채권의 유통 가격이 변동되어 생긴 시세 차익 채권의 안정성은 정부, 공공단체, 주식회사 등 발행 기관의 신뢰도를 확인채권 가격은 시중 금리와 반대로 움직인다. 시중 금리가 오르면 채권 가격은 내려가고, 시중 금리가 내려가면 채권 가격이 올라간다.전환사채CB(Convertible Bond) : 약정 기간 이후 투자자가 발행된 채권을 주식으로 바꿀수 있는 채권 - 투자자는 발행 회사의 주가가 상승하면 채권을 주식으로 바꿔 시세차익을 보고 주가가 하락하면 채권을 유지해 채권 수익을 볼수 있음 - 이자 수준이 일반 채권보다 낮음신주인수권부사채BW(Bond with Warrant) : 투자자에게 발행 회사의 신주를 인수할 .. 2018. 11. 13.
27일간 경제탐험 _차성훈 애덤스미스 국부론 ‘우리가 저녁식사를 할 수 있는것은 푸줏간 주인의 박애심 때문이 아니라 그들의 돈벌이에 댜한 관심 덕이다’ 효용Utility - 재화나 서비스를 소비하면서 느끼는 만족 한계효용Marginal Utility - 재화나 서비스를 한 단위 추가로 소비할때 느끼는 만족 총 효용 - 재화나 서비스를 소비할 때 느끼는 만족의 총 합 합리적인 판단은 총 효용을 가장 크게 만들도록 소비하는 것 배고플때 첫번째 물고기는 7만원 두번째는 4만원.. 배불러짐에 따라 한계효용은 점차 줄어들어 -가 되기도 함 3대 경제활동 생산 - 재화나 서비스를 만드는 등 가치를 증대시키는 활동 분배 - 생산활동에 필요한 생산요소를 재공하고 그 대가를 받는 활동 소비 - 만족을 얻기위해 재화나 서비스를 구입하고 사용하는 활.. 2018. 10. 18.
칭기스칸 리더십 칭기스칸 전략과 리더십1. 기업성장 3단계 사업시작 및 국내 초기시장 - 사업확장 - 사업지속성장 4차산업혁명 돌파의 키워드(핵심 경쟁력)는 스피드 경영의 3대 요소 프레임 People - Strategy - Execution 2.테무진의 생존 DNA - 지속적 훈련, 성을 쌓는자 멸망한다, Stay hungry, stay follish - 늘 배우고 남보다 빨리 배우라, 말타며 활쏘는 기술, 화포기술 - 공자 일신우일신 매일 배워 새롭게하라 - 피터 드러커 - 평생 학습만이 생존을 보장한다 - 새클턴 - 생존의 리더십 남극을 정복 못했어도 모두 살아돌아옴 3. 테무진의 조직변화 - 존 코터의 변화관리 8단계 변하지 않으면 죽음이다. 긴박감조성->강력한 혁심팀->비전창조->비전전달->임파워먼트 ->계획 .. 2018. 6. 29.
빅데이터 비즈니스 모델 IDC의 빅데이터 생태계 : 데이터 창출 -> 획득 -> 정보처리 -> 비즈니스 프로세스빅데이터 비즈니스 모델 - 데이터로 던벌기 - 데이터 분석에 도움이 되는 인프라 제공 - 데이터 자체로 사업화 세가지 요소가 결합하여 가치 제공 - 콘텐츠 - 고객 경험 - 플랫폼 고객 가치 - 데이터를 중심으로 역량을 만들고 차별화 판도라 Spotify, Netflic : 고객 맞춤화 콘텐츠아마존 종이책, 전자책 : 고객 책 추천 프로세스 빅데이터 비즈니스 모델 유형 1) 데이터 과학자 : 데이터 비즈니스 맨 - 활용방안 데이터 창출자 - 데이터가공분석 새로운 정보 지식창출 데이터 개발자(대리인) - 분류저장유지관리 전문가 데이터 연구가 - 특정 분야 산업지식에서 활용 데이터 응용가 - 기존 서비스를 빅데이터를 이용.. 2018. 6. 21.
Web Scraper 기본 [필요 모듈]requestsBeuatifulSoup4 - HTML를 파싱하기 좋게 파이썬 객체로 리턴lxml - 파싱가능한 HTML으로 변경 [요청하기]import requestsres = requests.get('http://book.naver.com')res.text'\r\n\r\n....... [proxy 있는 경우]from requests.auth import HTTPProxyAuth proxyDict = { 'http' : '70.10.15.10:8080', 'https' : '70.10.15.10:8080'}res = requests.get('http://book.naver.com', proxies=proxyDict) 작성중 2018. 5. 18.
Python IDE 개발환경, pip proxy ssl 문제해결 [python 다운로드 및 설치]https://www.python.org/다운로드 및 설치 (Window 10 기준)설치 위저드에서 Path추가 체크 [IDE 다운로드 및 설치]https://www.jetbrains.com/pycharm/download/#section=windowsCommunity 버전으로 다운로드 및 설치Lightweight IDE for Python & Scientific development IDE를 실행한 후 좌측 아래 모니터?처럼 생긴 기능 버튼 누르면Terminal과 Python Console이 나타남 [pip install]Terminal에서 pip install PACKAGENAME 으로 패키지 설치 가능 [proxy와 ssl문제 발생 시]pip install --trus.. 2018. 5. 10.
Accuracy, Precision, Recall Classification 분류 종속변수가 정수 또는 클래스Regression 회귀 종속변수가 실수 Regression에서의 Metric 측정은실제와 예측 함수(회귀함수) 사이의 거리값의 합으로 성능을 평가할 수 있음그 거리가 클 수록 정확도가 떨어짐예를 들어 L2 norm, L1 norm, L-infinite norm 값 Classification 에서의 Metric 측정은Accuracy 전체 정답률 - 일반적이지만 inbalance한 데이터의 경우 눈 먼 값이 될 수 있음Precision 양성 항목 정답률 - 여기서 양성 항목이란 내가 집중하는 항목Recall 양성 항목 검출률 - 여기서 검출률이란 실제 내가 집중하는 항목만 봤을 때 판정 정답률 1000명 환자 정상판정 암판정 정상환자 988 2 암.. 2018. 5. 9.
초대장 나누어드립니다 9장(완료) 초대장 발송 완료되었습니다.혹시 초대 응답 안하시는 분 있으면 다시 선정해서 보내드릴께요. 2018. 5. 8.
반응형