프로그램

pdf를 아래한글 hwp로 변환

sungtg 2015. 3. 18. 13:25

파일의 속성 


pdf 파일



이미지와 텍스트로 이루어진 프린터파일. 

화면에 보이는 그대로를 프린터 처럼 이미지화 시켜서 만든 파일입니다.


hwp 파일.



hwp 파일은 워드프로세서 프로그램으로 고유의 코드 값을 갖습니다.

아래한글에서 제공하는 폰트, 표, 기타 메뉴를 이용하는 모든 속성은 호환이 안됩니다


변환하기 전에 준비 할 것.


pdf-pro 프로그램 : pdf 작성할 수 있는 프로그램

아래한글

오피스 워드


pdf 문서 파일을 문서 형태를 그대로 hwp로 바꾸는 것을 고려할 때 최선의 방법은 

pdf문서를 html 파일로 만드는 것이 제일 좋습니다.

html은 hwp에서 불러 올 수 있으므로 문서의 형태를 그대로 가져 올 수 있겠지요


방법 


1. pdf를 html로 변환해주는 툴이나 사이트를 이용한다


    편하기는 하지만 외국 사이트가 많고, 문서 내용 중에 한글 관련 특수문자나, 

    표, 기타  텍스트를 제외한 것 내용이 많다면, 

    변환 할 수 있는 정도는 50%를 예상하면 됩니다



2. 워드에서 pdf를 불러와서 html로 변환하기


     pdf에서 doc 파일로 저장을 시킬 수도 있고,

    워드에서 pdf 파일을 불러 들일 수 있으므로, 보안이 걸리지 않은 pdf파일이라면

    일단 워드로 불러 와서, 다시 새이름으로 html를 저장을 한다.


    워드에서 hwp를 불러 올 수도 있으므로, 

    워드에서 pdf파일을 불러서, 편집상태에서 아래한글에 복사가 되는지를 일단 점검을 해볼 필요가 있습니다.


    pdf를 워드로 변환이 가능하다면, hwp로 변환가능성은 70%가 넘겠지요

   



부연 설명.


중요한 것은 pdf파일이 텍스트pdf 이면, 마우스 드래그를 하면, 텍스트가 블럭으로 잡힙니다.

그럼 일단 성공할 수 있는 가능성이 높겠지요

잡히지 않는다면 이미지 pdf 이므로, 아래한글로 만드는 의미가 없어 지겠네요.


변환에서 중요한 요소는 원시데이타에서, 기본 윈도우에서 인식하는 데이타가 얼마나 되는지

판단을 하는 것입니다. 


그런다음, 변환할 때는 역순으로 

마지막 데이타를 받을 hwp파일의 구조, 

그런 다음 pdf와 가장 친한 프로그램을 찾고, 아래한글과 상관관계를 풀면 

변환을 할 수 있는지, 판단을 할 수 있습니다.


특히 문서에 표내용이 많을 경우에는 html 변환 방식을 권하고 싶은데

약간의 html의  table 태그 공부만 한다면 어려울 것은 없을 것 같습니다