본문 바로가기
  • Let's go grab a data
반응형

Python18

파이썬 자연어 처리 기초(NLTK) \이미지 출처: 자연어 처리 입문 강의 자료 (이성주) pypi https://pypi.org/project/nltk/ 서울대 http://konlpy.org/en/latest/ GPL v3 오픈소스 라이선스구글 https://cloud.google.com/natural-language/ import nltknltk.download()from nltk.corpus import gutenberggutenberg.fileids() #파일 목록#nltp에서 제공하는 corpus 리더기raw_text = gutenberg.raw('austen-emma.txt')print(raw_text[:100]) #raw 리더기를 안쓰는 경우 아래와 같이 path작업을 계속해줘야함import osos.path.join(gut.. 2018. 12. 10.
Word, pdf 문서에서 문자열 추출하기, 파일 입출력, 인코딩 [문서에서 문자열 추출] https://pypi.org/project/pyautomate/ > pip install pyautomate import pyautomatefrom pyautomate.office import Worddocx = Word('test.docx') from pyautomate.pdf import PDFDocumentpdf = PDFDocument('test.pdf')본문 = pdf.extract_text()print(본문) [파일 입출력]file = open('test.txt')filebody = file.read()file.close()print(body) #파이썬 스타일with open('test.txt') as file: body = file.read() print(body).. 2018. 12. 10.
윈도우에서 웹 크롤링 Windows Web Crawling 환경설정 Python과 pip은 설치되어 있음 가상환경 설정C:\>pip install virtaulenv virtualenvwrapper C:\>virtualenv NAME아래 가상환경 진입C:\NAME\Scripts>activate.bat아래 가상환경 나가기(NAME) C:\NAME\Scripts>deactivate.bat virtualenv 만들 때 setuptools, pip, wheel을 다운로드 받는데 Proxy등 문제로 안될 경우 pip download --no-cache --proxy http://PROXYSERVER:PORT --trusted-host pypi.python.org setuptools wheel pipvirtualenv --no-download --extra-search-dir /o.. 2018. 12. 3.
Python IDE 개발환경, pip proxy ssl 문제해결 [python 다운로드 및 설치]https://www.python.org/다운로드 및 설치 (Window 10 기준)설치 위저드에서 Path추가 체크 [IDE 다운로드 및 설치]https://www.jetbrains.com/pycharm/download/#section=windowsCommunity 버전으로 다운로드 및 설치Lightweight IDE for Python & Scientific development IDE를 실행한 후 좌측 아래 모니터?처럼 생긴 기능 버튼 누르면Terminal과 Python Console이 나타남 [pip install]Terminal에서 pip install PACKAGENAME 으로 패키지 설치 가능 [proxy와 ssl문제 발생 시]pip install --trus.. 2018. 5. 10.
자료형 - List #리스트 : 객체들의 순서가 있는 모임Collection#[], len(), max(), min(), count()a_list = [1,2,3]print("Output #58: {}".format(a_list))print("Output #59: {}".format(len(a_list)))print("Output #60: {}".format(max(a_list)))print("Output #61: {}".format(min(a_list)))another_list = ['printer',5,['star','circle',5]]print("Output #62: {}".format(another_list))print("Output #63: {}".format(len(another_list)))print("Out.. 2018. 2. 13.
날짜 다루기 [날짜 다루기] from math import exp, log, sqrtimport refrom datetime import date, time, datetime, timedelta today = date.today()print("Output #41: today:{0!s}".format(today))print("Output #42: year:{0!s}".format(today.year))print("Output #43: month:{0!s}".format(today.month))print("Output #44: day:{0!s}".format(today.day))current_datetime = datetime.today()print("Output #45: datetime:{0!s}".format(cur.. 2018. 2. 7.
Hello python, ipynb 파일 py 파일로 만들기, 실행, 자료형 jupyter notebook을 열고 하단의 스크립트를 작성하여 first_script.ipynb로 저장하고 실행한다print("Output #1: hello python")Output #1: hello python x=4y=5z=x+yprint("Output #2: four plus five equals {0:d}.".format(z))Output #2: four plus five equals 9. a=[1,2,3,4]b=["first","second","third","fourth"]c=a+bprint("Output #3: {0},{1},{2}".format(a,b,c))Output #3: [1, 2, 3, 4],['first', 'second', 'third', 'fourth'],[1, 2, 3, 4.. 2018. 1. 9.
MNIST 데이터 집합 읽어오기, 이미지로 나타내기 MNIST 데이터 집합 읽어오기, 이미지로 나타내기 MNIST 데이터는 머신 러닝 분야에서 광범위하게 사용되는 손글씨 숫자 0~9가 흑백으로 저장된 이미지 [데이터 다운로드]http://yann.lecun.com/exdb/mnist/ ( train-images-idx3-ubyte.gz, train-labels-idx1-ubyte.gz, t10k-images-idx3-ubyte.gz, t10k-labels-idx1-ubyte.gz) [입력을 도와주는 스크립트 다운로드]https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/mnist/input_data.py Python 스크립트와 동일한 폴더에 input_data... 2017. 4. 14.
Python 개요, 기초 문법 Python으로 할 수 있는 것1. 시스템 유틸리티 제작 파이썬은 운영체제의 API들을 이용할 수 있는 각종 도구를 갖추고 있어서, 이를 바탕으로 갖가지 시스템 유틸리티를 만드는 데에 유리합니다. 시스템에서 사용중인 서로 다른 유틸리티성 프로그램들을 하나로 뭉쳐서 큰 힘을 발휘하게 하는 프로그램들을 무수히 만들어낼 수 있습니다. 2. GUI 프로그래밍 GUI 프로그래밍이란 쉽게 말해 그래픽으로 이루어진 소프트웨어를 만드는 것을 뜻합니다. 파이썬으로 GUI 프로그램을 만드는 것은 다른 언어보다 훨씬 쉽습니다. 파이썬에 내장되어 있는 기본 모듈인 Tkinter를 이용해 단 5줄의 소스 코드만으로도 창을 하나 띄울 수가 있습니다. 파이썬에는 wxPython, PyQT, PyGTK등과 같이 Tkinter보다 더.. 2017. 3. 8.
반응형