일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
- 디버깅
- 통합개발환경 추천
- tf-idf
- bow
- 블로그 도메인 주소 변경
- Rout 53
- 좋은 기능
- 로그인 후 크롤링
- 자연어 처리
- 유사도
- AWS
- authentication faile
- 일반항 유도
- 웹 사이트 만들기
- 빠른 개발
- 통계적 언어모델
- 피보나치 수열
- 하드코딩
- 웹 개발
- 성능비교
- IDE 추천
- 플라스크
- bag of words
- 가상환경
- 코드 구현
- 셀레니움
- VS Code
- python-docx
- 계정정보
- token
- Today
- 58
- Total
- 100,137
목록전체 글 (25)
DoITgrow
들어가며 python-docx 패키지는 파이썬으로 Microsoft Word를 제어할 수 있는 툴입니다. 자세한 사용법은 패키지를 설명한 사이트에 들어가면 잘 정리되어 있으니 해당 사이트를 참고하시면 됩니다. 그러나 해외에서 제작한 패키지이다 보니 한글을 처리하기에는 많이 복잡합니다. 그래서 패키지에서 한글 폰트를 원하는 것으로 설정할 수 있는 방법에 대해 공유하고자 합니다. 한글 폰트 적용 방법 먼저 한글에 폰트가 적용되지 않는 이유는 영어와 한글의 다른 문자 체계 때문입니다. 기본적으로 한글은 eastAsia로 분류된다고 합니다. 따라서 python-docx 패키지에서 폰트를 적용하려면 기본적으로 어떤 문자 체계인지를 같이 알려줘야 됩니다. from docx.oxml.ns import qn impor..

들어가며 안녕하세요. 오늘 소개드릴 내용은 웹 크롤링할 때 많이 사용하는 셀레니움 패키지에 관한 내용입니다. 아마도 셀레니움의 디버깅 모드를 알고 계시는 분들은 크롤링 알고리즘을 만들 때 시간을 많이 절약하실 것 같고, 모르시는 분들은 크롤링 절차를 추가할수록 디버깅 시간이 더 오래걸릴 것 같네요. 그만큼 알고있으면 좋은 디버깅 모드에 대해 알려드리겠습니다. 셀레니움 디버깅 모드의 편리성 예를들어 아래와 같은 과정으로 크롤링 코드를 작성한다고 할 때, "B"에 대한 코드를 작성하는 단계라고 한다면 디버깅시간은 금방 걸릴 것입니다. 디버깅 모드 필요없이 그냥 실행해도 "A → B"까지의 코드 동작 과정만 확인하면 되니까요. 그러나 만약 마지막 단계인 "E"에 대한 코드가 정상적으로 작성되었는지 확인하기 위..
안녕하세요. 오늘은 간단히 파이썬 Pandas(판다스) 패키지의 좋은 기능 하나를 소개해 드리려고 합니다. 데이터 분석을 위해서 거의 70% 이상의 시간을 데이터 전처리하는데 쓰는 거 같아요. 저는 이제 엑셀보다 파이썬 판다스가 편해서 엑셀을 잘 안열고, 판다스를 많이 사용하는 것 같아요. 그래도 아직 알아야한 기능들이 있어서 지속적으로 공부하는 것이 필요할 것 같네요. 오늘은 문자열을 전처리하는 방법 중 하나로 문자열을 분리하는 방법을 소개드리려고 합니다. 데이터를 수집하다 보면 간혹 잘 분리되었지만 미처 분리되지 않고, 다른 구분자로 구분되어 있는 데이터 형태를 만날 수 있습니다. 예를들어 csv 파일을 콤마( , )로 구분하여 데이터프레임 형태로 얻었는데, 특정 부분은 콤마가 아닌 세미콜론( ; )..

안녕하세요. 자연어 처리를 할 때, 형태소 분석기는 매우 중요하죠. 오늘은 윈도우10 환경에서 Mecab 형태소 분석기를 설치하고 활용하는 방법에 대해서 알아보겠습니다. 사전에 설치가 필요한 프로그램 Mecab 형태소 분석기는 Java 언어로 구현된 라이브러리이므로 파이썬에서 작동시키려면 파이썬에서 자바 언어를 해석할 수 있어야 합니다. 그러게 위해 필요한 것은 파이썬을 대신하여 자바 언어를 읽고 파이썬에게 통역해주는 프로그램이 필요합니다. 바로 2가지 JDK 라고 부르는 "Java SE Development Kit"과 "Jpype" 프로그램 설치가 필요합니다. 단순하게 어떤 패키지를 설치해야 하는지 외우기 보다는 각각의 프로그램이 하는 역할을 같이 알고 계시면 나중에 다시 환경설정을 할 때, 금방 기억..

들어가며 오늘은 본격적인 웹 개발을 위한 사전 준비로 가상환경과 패키지를 준비하는 것에 대해 포스팅하려고 합니다. 또한 간략히 만든 웹 페이지를 자체 서버를 통해 열어보는 것까지 본 포스팅에서 다루고자 합니다. ▼ 앞으로 구현할 웹의 상세 내용은 첫번째 포스팅을 통해서 파이썬을 이용하여 앞으로 만들어볼 웹 시스템을 간략히 소개드렸으니 참고하시면 될 것 같습니다. 2021.12.11 - [백엔드 & 프론트엔드 & DevOps] - [파이썬 활용 웹 개발] 인트로 - DB 공유/관리 시스템① [파이썬 활용 웹 개발] 인트로 - DB 공유/관리 시스템① 배우고 싶은 것은 많은데 시간은 한정되어 있고, 또 회사 일과 병행하다 보면 하루 24시간이 너무 짧다는 생각이 부쩍 드네요. 딥러닝 알고리즘과 같이 개념을 ..