본문 바로가기

728x90
반응형
728x170

한 두장이야 눈으로 일일이 보면서 데이터를 기입하지, 그것이 20장 넘어가면 답이 없다.

엑셀이면 다행이지만 pdf면... 우와....

그래 ocr을 돌려보자!

 

그런데 이 ocr이라는 것도 완벽하지 않아서 행이든 열이든 뒤죽박죽으로 

한 두장이야 눈으로 일일이 보면서 데이터를 기입하지, 그것이 20장 넘어가면 답이 없다.

 

엑셀이면 다행이지만 pdf면... 우와....

 

그래 ocr을 돌려보자!

 

 

 

그런데 이 ocr이라는 것도 완벽하지 않아서 행이든 열이든 뒤죽박죽으로 데이터를 나열한다.

 

어떤 함수들로 해결할 수 있을까? 

그냥 간단하게 vba를 이용하여 특정 단어를 포함한 단어를 뽑아내서 정리를 하면 되지만 왠지 엑셀 함수로 해결하고 싶어 졌다. 그래서 맨 처음 생각한 함수가 indirect().

하나의 셀이든 배열이든 입력된 내용을 레퍼런스로 삼아 데이터를 끌어오는 기특한 녀석이다.

각 시트마다 이름이 다르니 이에 달라지는 주소를 반영할 때 유용하다.

자 그럼 각 시트마다 배분된 데이터는 하나의 시트에 모았고,

원하는 단어가 포함된 데이터를 어떻게 솎아내지?

hlookup(), *

ocr을 이용, 추출된 엑셀 데이터는 특히나 열의 배치가 엉망이다.

나름 이쁘게 한다고 중앙 정렬된 글자들은 여러 열에 걸쳐 뒤죽박죽으로 입력이 되어 있다.

그래서 *를 이용하여 특정 단어가 포함된 이라는 조건을 걸고 그것을 hlookup()에 넣어 원하는 데이터만 솎아내는 것이다.

 

그냥 vba()를 이용 각 시트마다 특정 단어를 포함 데이터를 뽑아내라니까!!!!

for이나 do while를 이용하여 각 셀 하나하나마다 검색한 뒤 특정 단어가 포함된 셀 데이터를 뽑아내면 간단하기는 하지만... 뭐든지 돈이 문제니... 그만큼 믿어주고 인정해 주면 해 주는 거고.... 아니면... 걍 일자리나 늘려주는 거지 뭐...

괜히 vba 만들어줘서 누구 모가지 댕강 시키려고...

 

여튼 indirect()와 hlookup()에 대해서 배워봤다.

그런데 만약 그 특정 단어가 '절대방위각, 경사각'이렇게 중간에 위치하면 어떻게 해야 하나요?

그때는 뭐 이렇게 하면 되지...

그런데... 이제 xlookup()이 있는데 굳이 vlookup()하고 hlookup() 쓸 필요 있나?

이 놈을 이용하면 행과 열에 일치하는 녀석 아니 들을 불러올 수 있다.

그런데 얘는 또 *가 안 먹히네...

반응형
그리드형
영덕박달대게 택배 영양 태양광 1.9mw 전복소라 영덕 태양광 1.7mw 이시가리(줄가자미) 공장 위 500kW 고둥 영덕박달대게 택배 돌문어 영덕박달대게 택배 영덕박달대게 홑게 회 신재생에너지
#강구박달대게 시세는(054-734-0458)
#태양광 상담은(010-2668-3897)...