Salary Range
$102,000 - $138,000 /year
EstimatedThis salary is estimated based on similar roles. The actual salary may vary.
ν©λ₯νκ² λ νμ λν΄ μλ €λλ €μ
β’ ν μ€μ¦κΆ ML Engineer(OCR)μ Automation Platform Teamμ μν΄ μμ΄μ.
β’ Automation Platform Team(APT)μ 'κΈ°μ λ‘ λ¬Έμ λ₯Ό ν΄κ²°νμ¬ μ¬λλ€μκ² μ€μ§μ μΈ κ°μΉλ₯Ό μ 곡νλ€'λ λ―Έμ
μλ, ν μ€μ¦κΆμ μμ°μ±μ 10λ°°λ‘ λμ΄μ¬λ¦¬κ³ μ§μ κ°λ₯ν μ€μΌμΌμ
μ λ§λ€μ΄κ°λ νμ΄μμ.
β’ μ΄λ₯Ό μν΄ OCR, μ€ν¬λν, QA μλν λ± λ€μν μλν μ νμ μ§μ λ§λ€κ³ μ΄μνλ end-to-end μμ§λμ΄λ§μ λ΄λΉνκ³ μμ΄μ.
ν©λ₯νλ©΄ ν¨κ» ν μ
무μμ
βοΈ ν μ€μ¦κΆ Retail μ
무 μλν OCR κ°λ°μ λ΄λΉν΄μ.
β’ ν μ€μ¦κΆ λ΄ μμμ
μΌλ‘ μ²λ¦¬λκ³ μλ λ€μν Retail μ΄μ μ
무λ₯Ό OCRλ‘ μλνν΄μ.
β’ μΈλΆ κΈ°κ΄μμ λ°κΈλλ μλ₯μ λ΄λΆ κ²μ λμ μ½ν
μΈ λ₯Ό λ¨κ³μ μΌλ‘ OCR νμ΄νλΌμΈμ νΈμ
μν€κ³ , μ£μ§ μΌμ΄μ€μ λν μΈμλ₯ μ λμ΄μ¬λ¦¬λ©° 컀λ²λ¦¬μ§λ₯Ό νμ₯ν΄ λκ°μ.
β’ λλ©μΈ PO/μμ§λμ΄μ μ§μ λ¬Έμ λ₯Ό μ μνκ³ , OCRμ΄ ν΄κ²°ν΄μΌ νλ μ§μ κ³Ό νμ€μ μΈ λμμ ν¨κ» μ€κ³ν΄μ.
βοΈ OCR νμ΅ νμ΄νλΌμΈμ ꡬμΆν΄μ.
β’ OCR/VLM λͺ¨λΈμ νμΈνλνκ³ κ³ λνν΄μ.
β’ λ°μ΄ν° μμ§/μ μ²λ¦¬/augmentation/νκ°/λ°°ν¬κΉμ§ μ λ¨κ³λ₯Ό ML Engineerκ° μ£Όλν΄μ.
βοΈ OCR λͺ¨λΈ μ€νμ μ΄μμ λ΄λΉν΄μ.
β’ μ€νμμ€ OCR/VLM, document layout, orientation λΆλ₯κΈ° λ± νμ¬ μ€νμ λ€λ£¨λ©°, νμμ λ°λΌ λͺ¨λΈμ κ΅μ²΄νκ±°λ in-houseλ‘ νμ΅ν λͺ¨λΈμ λμ
ν΄μ.
β’ OCR λͺ¨λΈλΏλ§ μλλΌ, μ /νμ²λ¦¬ λ‘μ§ λ± end-to-endλ‘ νμ§μ μ±
μμ Έμ.
βοΈ μ΄μ νκ²½μ λͺ¨λΈ μμ μ±μ μ±
μμ Έμ.
β’
μλΉμ€ μμ§λμ΄μ κΈ΄λ°νκ² νμ
νλ©° λ°νμ μμ μ±κ³Ό μ νλλ₯Ό ν¨κ» λμ΄μ¬λ €μ.
μ΄λ° λΆκ³Ό ν¨κ»νκ³ μΆμ΄μ
β’ μ΄λ―Έμ§/λ¬Έμ μ²λ¦¬ κ²½νμ΄ μλ λΆμ μ°Ύκ³ μμ΄μ.
β’ Python(OpenCV, PyMuPDF), Node(sharp) λΌμ΄λΈλ¬λ¦¬λ₯Ό νμ©ν μ΄λ―Έμ§/λ¬Έμ μ²λ¦¬ κ²½νμ΄ νμν΄μ.
β’ λλμ μ΄λ―Έμ§λ₯Ό λ²μ£Όννκ³ , μ§μλ² μ΄μ€μμ μ μ°ΎμλΌ μ μλλ‘ μλ² λ©, μΈλ±μ± ꡬ쑰λ₯Ό μ€κ³/μ΅μ νν΄ λ³Έ κ²½νμ΄ μλ λΆμ΄λ©΄ μ’μμ.
β’ VLM/OCR λͺ¨λΈλ§ κ²½νμ΄ μλ λΆμ μ°Ύκ³ μμ΄μ.
β’ SOTA VLM/OCR λͺ¨λΈμ λΉ λ₯΄κ² μ μ© λ° νκ°ν΄ λ³Έ κ²½νμ΄ νμν΄μ.
β’ LoRA λ± λλ©μΈ νΉν νλ κ²½νμ΄λ, μμ λͺ¨λΈμ μ νλ/κ°μ©μ± μ΅μ ν κ²½ν, document layout λͺ¨λΈ νμ© κ²½νμ΄ μμΌλ©΄ μ’μμ.
β’ νμ΅ λ°μ΄ν° νμ΄νλΌμΈ μ€κ³ κ²½νμ΄ μλ λΆμ μ°Ύκ³ μμ΄μ.
β’ λλ©μΈ λ¬Έμλ₯Ό ν©μ±νκ³ λ μ΄λΈμ μλ μμ±ν΄ λ΄€κ±°λ, μ€μ μ
λ ₯ λΆν¬λ₯Ό λͺ¨μ¬νλ augmentation μ λ΅(μ€μΊ,ν©μ€,JPEG λ±)μ μ€κ³ν΄ λ³Έ κ²½νμ΄ νμν΄μ.
β’ λλ νμ΅ λ°μ΄ν°κ° λΆμ‘±ν μν©μμλ κ°λ°ν΄ λ³Έ κ²½νμ΄ μμΌλ©΄ μ’μμ.
μ΄λ° κ²½νμ΄ μλ€λ©΄ λ μ’μμ
β’ κ°μΈμ 보 νκΉ
, λμ₯, μ νμ§ μ€μΊ λ± κΈμ΅ λλ©μΈ λ¬Έμμ νΉμμ±μ μ΄ν΄νκ³ λ€λ€λ³Έ κ²½νμ΄ μλ€λ©΄ λ μ’μμ.
β’ λ°μ΄ν° μμ§/μ μ²λ¦¬ β λͺ¨λΈλ§ β μλΉμ€ μ μ©κΉμ§ μ 체 νμ΄νλΌμΈμ νΌμμ λκ³ κ° μ μλ λΆμ΄λ©΄ λ μ’μμ.
β’ DVC, MLflow λ±μΌλ‘ νμ΅ λ°μ΄ν°μ μ€ν κ²°κ³Όλ₯Ό μ¬ν κ°λ₯νκ² κ΄λ¦¬ν΄ λ³Έ κ²½νμ΄ μλ€λ©΄ λ μ’μμ.
β’ μ λ
Όλ¬Έ/릴리μ€λ₯Ό λΉ λ₯΄κ² μ°Ύμ μ¬λ΄ μ μ© κ°λ₯μ±μ νλ¨ν μ μλ λΆμ΄λ©΄ λ μ’μμ.
β’ μ λΆ λ¬Έμ, κ°μΈμ 보 λ¬Έμ λ± νμ΅/μ¬μ²λ¦¬ κ³Όμ μμ μ¬μ©λλ λ¬Έμμ 보μ λ° μ»΄νλΌμ΄μΈμ€ μ μ½μ ν¨κ» κ³ λ €ν΄ λ³Έ κ²½νμ΄ μλ€λ©΄ μ’μμ.
β’ DocOwl λ± λ¬Έμ νΉν λͺ¨λΈμ μ€μ νλ‘λμ
μ λΆμ¬λ³Έ κ²½νμ΄ μλ€λ©΄ λ μ’μμ.
β’ Qwen-VL, InternVL λ± vision λͺ¨λΈμ μ€μ νλ‘λμ
μ λΆμ¬λ³Έ κ²½νμ΄ μλ€λ©΄ λ μ’μμ.
β’ PII λ§μ€νΉ, λΉμλ³ν νμ΄νλΌμΈ μ€κ³ κ²½νμ΄ μλ€λ©΄ λ μ’μμ.
μ΄λ ₯μλ μ΄λ κ² μμ±νμλ κ±Έ μΆμ²ν΄μ
β’ ν΄κ²°νλ €λ λ¬Έμ μ μ νν λ°©λ², κ·Έμ λ°λ₯Έ κ²°κ³Ό(μ§ν λ³νΒ·μ ν λ³ν)λ₯Ό λͺ
ννκ² μμ±ν΄ μ£ΌμΈμ.
β’ λͺ¨λΈ κ°λ°λΏ μλλΌ, μ΄μ κ³Όμ μμ μλνλ κ°μ λ΄μ©λ ν¨κ» μ μ΄ μ£Όμλ©΄ μ’μμ.
β’ μ 체 ꡬ쑰μ λ³ΈμΈμ ν΅μ¬ κΈ°μ¬λ₯Ό μ€μ¬μΌλ‘ μμ±ν΄ μ£ΌμΈμ. μΈλΆ 곡κ°κ° μ΄λ €μ΄ λ΄μ©μ μ μΈν΄ μ£ΌμΈμ.
ν μ€μ¦κΆμμ μ¬μ©νλ κΈ°μ
β’ PyTorch, PEFT, onnxruntime-node, vLLM
β’ OpenCV, PyMuPDF, sharp
β’ NestJS, FastAPI, Gin
β’ DBOS, DVC, MLflow
ν μ€μ¦κΆμΌλ‘μ ν©λ₯μ¬μ
β’ μλ₯μ μ > μ§λ¬΄ μΈν°λ·° > λ¬Ένμ ν©μ± μΈν°λ·° > λ νΌλ°μ€ μ²΄ν¬ > μ²μ°νμ > μ΅μ’
ν©κ²© λ° μ
μ¬
κΌ νμΈν΄ μ£ΌμΈμ
β’ μ΄λ ₯μ λ° μ μΆ μλ₯μ νμ μ¬μ€μ΄ λ°κ²¬λκ±°λ 근무 μ΄λ ₯ μ€ μ§κ³μ¬νμ΄ νμΈλ κ²½μ°, μ±μ©μ΄ μ·¨μλ μ μμ΄μ.
β’ ν μ€μ¦κΆ λ΄κ·μ λ°λΌ μ±μ© κΈμ§μ λλ 결격μ¬μ ν΄λΉμλ μ±μ©μ΄ μ·¨μλ μ μμ΄μ.
β’ μ₯μ μΈ λ° κ΅κ°λ³΄νλμμλ μ§μ μ κ΄λ ¨λ²μ λ°λΌ μ°λνκ³ μμ΄μ.
ν¨κ» ν λλ£λ₯Ό μν νλ§λ
"λ³ΈμΈμ΄ κ°κ³ μλ κΈ°μ μ μλμ ν΅ν΄ μ€μ§μ μΈ λΉμ¦λμ€ μν©νΈλ₯Ό μ΄λμ΄λ΄κ³ μΆμλ λΆμ΄λΌλ©΄ ν° λ§μ‘±κ°μ μ»μΌμ€ μ μμ κ±°μμ!"
β’ ν μ€μ¦κΆμ OCR λͺ¨λΈλ§κ³Ό νμ΄νλΌμΈ μ λ°μ μ£Όλμ μΌλ‘ μ΄λμ΄κ° ML Engineerλ₯Ό κΈ°λ€λ €μ.