본문 바로가기

각 종 it/파이썬, 업무자동화 RPA

파이썬, 파파고를 이용 한 무료 웹툰 번역 프로그램 이미지를 읽는 코드를 짰었다. 2021.07.05 - [각 종 it/파이썬, 업무자동화 RPA] - Screenshot Img to TXT, tesseract 정확도 높이는 방법 Screenshot Img to TXT, tesseract 정확도 높이는 방법 + =???? 이거다. 이전 글에서도 언급 했다만, 프레임을 만들어 스크린샷을 찍을려고 2021.07.05 - [각 종 it/파이썬, 업무자동화 RPA] - tkinter 프레임배경 투명하게 만들기, 파이썬으로 스크린샷 프레임 aldkzm.tistory.com 그런데 이 것을 그대로 나두기에는 뭔가 부족 했다. 그래서 이미지의 글자를 읽어 번역하는 코드를 짜봤다. 사용법은 간단하다. 이미지에 포함 된 글자의 스크린샷을 찍으면 자동으로 번역 해 주는 그..
파이썬, 여러 PDF 일괄 회전 코드 대부분 그렇지 않으나, 가로로 출력 되는 PDF 파일을 공공기관에서 다운 받으면 무조건 세로로 나온다. 이 것을 일일히 까뒤집어도 되고, 아니면, 웹페이지를 이용하거나 동시에 모든 PDF 파일을 열어 작업하는 것도 한 방법이다. 그럼 왜 만들었어요? 다운 받을 때 마다 일일히 작업을 한텐가? 걍 다운 받을 때 알아서 회전하도록 바꾸면 안 될까? 그도 그럴 것이 얼마 전에 2021.07.11 - [각 종 it/파이썬, 업무자동화 RPA] - [python] return, pass, continue, break, 함수 종료 명령어 [python] return, pass, continue, break, 함수 종료 명령어 인터넷에 ‘함수 종료 명령어’로 서칭을 하면 대부분, sys.out이나 quit을 알려준다..
[python] return, pass, continue, break, 함수 종료 명령어 인터넷에 ‘함수 종료 명령어’로 서칭을 하면 대부분, sys.out이나 quit을 알려준다. 그런데 이 함수들을 써 버리면, 스레드 전체가 정지 해 버린다. 즉, 프로그램이 멈춰 버린다. 이번에 구현한 프로그램은 바로 찍은 스크린샷을 이용하여 그 사진을 기준으로 클릭을 해주는 프로그램이다. 스크린샷을 찍기 위해서는 좌표를 알아야 하고, 이 좌표를 구하기 위한 좌표를 찍기 위한 버튼을 대기 하기 위해서는 반복문(loop)을 돌려야 한다. 위 이미지 처럼 바로 스크린샷을 찍은 다음 등록한 매크로 단축키를 누르면, 해당 이미지를 서치하여 글자를 복사 한 뒤 엑셀로 복사 붙이기 한다. A~ 그냥 직접하면 되지 뭣하러 매크로를 돌려요? 예시로는 저렇게 만들었지만, 저것을 응용한다면, 몇 백장의 상호명이나 기타 한..
Screenshot Img to TXT, tesseract 정확도 높이는 방법 + =???? 이거다. 이전 글에서도 언급 했다만, 프레임을 만들어 스크린샷을 찍을려고 2021.07.05 - [각 종 it/파이썬, 업무자동화 RPA] - tkinter 프레임배경 투명하게 만들기, 파이썬으로 스크린샷 프레임을 만들어 보자. tkinter 프레임배경 투명하게 만들기, 파이썬으로 스크린샷 프레임을 만들어 보자. 2021.07.04 - [각 종 it/파이썬, 업무자동화 RPA] - pdf to txt, 파이썬으로 구현(pdfminer) pdf to txt, 파이썬으로 구현(pdfminer) 처음에는 이 영상을 보고, 구현 할려고 하니, 한글이 깨지는 것이다. 이 코드.. aldkzm.tistory.com 했다. 근디 만들고 나니까, 걍 찍는 것이 더 편할 듯 하여... 이전글과 cross는..
tkinter 프레임배경 투명하게 만들기, 파이썬으로 스크린샷 프레임을 만들어 보자. 2021.07.04 - [각 종 it/파이썬, 업무자동화 RPA] - pdf to txt, 파이썬으로 구현(pdfminer) pdf to txt, 파이썬으로 구현(pdfminer) 처음에는 이 영상을 보고, 구현 할려고 하니, 한글이 깨지는 것이다. 이 코드에서는 pypdf2이다. 동양인으로서 눈물을 머금고, 한글이 잘 되는 다른 라이브러리를 찾던 중 PDFMINER를 발견하게 되었 aldkzm.tistory.com 이전 글에서 스크린샷을 찍어서 그 이미지에서 바로 텍스트를 추출하는 코드를 구현하겠다고 한 적이 있다. 코드는 이미 구현하였지만, 문득 알캡쳐라든지 반디캡쳐 처럼 창을 하나 만들면 재미 있겠다 싶어 한번 만들어 보았다. 위에 보다 싶이 창의 왼쪽 상단 위치좌표와 창의 크기를 output하게 ..
pdf to txt, 파이썬으로 구현(pdfminer) 처음에는 이 영상을 보고, 구현 할려고 하니, 한글이 깨지는 것이다. 이 코드에서는 pypdf2이다. 동양인으로서 눈물을 머금고, 한글이 잘 되는 다른 라이브러리를 찾던 중 PDFMINER를 발견하게 되었다. 그래서 이렇게 함 구현 해 봤다. 변하고자 하는 pdf 파일을 선택하면, 새폴더 하나 만들고 그 안에 txt를 생성 pdf 파일 내용을 넣는다. 비록 표는 구현되지 않지만, 띄어쓰기 포함 글자가 잘 들어 가 있는 것을 볼 수 있다. 이미 ocr이 발달 했는데 굳이 이것을 구현 한 이유가... 무료로 지원하는 ocr 특히 pdf ocr의 경우 일일히 pdf 파일을 열어야 한다. 하지만 이 코드는 여러 pdf를 한꺼번에 처리 할 수 있다. 즉, 다수의 pdf 파일 내용 중 원하는 내용이 포함 된 pdf..
아래한글 누름틀 vs 메일머지.... 파이썬 없이 엑셀 데이터를 아래한글로 ㄱㄱㄱ 2021.06.20 - [각 종 it/파이썬, 업무자동화 RPA] - exel to hwp, 엑셀에 있는 데이터를 한글양식에 집어 넣자. exel to hwp, 엑셀에 있는 데이터를 한글양식에 집어 넣자. 필자가 워드프로세서 1급을 가지고 있지만, 한글과 컴퓨터는 정말 불편하다. 차라리 워드처럼 표에서 수식함수가 먹히는 것도 아니고, 이 것은 또 페이지 단위가 아닌 줄바꿈을 기준으로 구분 aldkzm.tistory.com 초창기 한글의 누름틀이라는 기능을 이용하여 필드명을 지정, 그 뒤 파이썬으로 엑셀 안에 있는 데이터를 각 요소마다 넣는 코드를 구현했다. 이렇게 처음 접근하다보니 아, 본디 누름틀이 그러라고 있는갑다하고 넘어 갔었는데, 어느 날 메일머지의 존재를 알게 되었다. 메일머지란 한글 안에서 지..
다중 hwp to pdf, 파이썬으로 구현 & 한글을 pdf로 만드는 글자가 깨질 때 오늘 구현 할 것은 여러개의 hwp을 pdf로 구현하는 프로그램이다. 회사원코드를 적극 활용하였으며, 그릇으로는 2021.06.30 - [각 종 it/파이썬, 업무자동화 RPA] - 파이썬으로 여러 포맷을 다중 인쇄 해 보자. + 이제 한번 ui도 적용 해 볼까~ 파이썬으로 여러 포맷을 다중 인쇄 해 보자. + 이제 한번 ui도 적용 해 볼까~ 2020.03.05 - [잡's생각/장인 장인 직장인] - 여러 PDF 파일을 한번에 인쇄 해 주게 하는 프로그램 여러 PDF 파일을 한번에 인쇄 해 주게 하는 프로그램 pdf파일을 하나로 통합하여 인쇄하면 되지만, pdf aldkzm.tistory.com 기존의 다중 인쇄 프로그램을 사용하였다. 위 강좌에서 다소 불필요한 코드는 들어냈고, 필요한 핵심코드만 사용..