RGB 영상부터 AI 통계분석까지, 씨더스 디지털육종 교육 이야기

2026 원예특작 디지털육종 표현체 교육, 2차 실습 현장 이야기
최근 국립원예특작과학원에서는 ‘2026 원예특작 디지털육종 표현체 교육’ 2차 실습 교육이 진행되었습니다.
이번 교육은 RGB 영상을 활용한 정밀 표현형 계측부터 AI 기반 객체 라벨링, 통계 분석과 시각화까지 이어지는 실전형 교육으로 구성되었으며, 씨더스는 표현체 데이터 분석과 컴퓨터 비전 기반 실습 교육을 직접 진행했습니다.
단순히 이론을 배우는 수준이 아니라, 실제 디지털육종 연구 현장에서 활용되는 분석 흐름 전체를 실습 중심으로 경험할 수 있었다는 점에서 의미가 컸습니다.
디지털육종 시대, 왜 표현체 데이터가 중요할까
최근 농업은 빠르게 데이터 중심 산업으로 전환되고 있습니다.
특히 디지털육종에서는 유전체 정보뿐 아니라, 작물이 실제 환경에서 어떻게 성장하고 반응하는지를 보여주는 표현형(Phenotype) 데이터의 중요성이 더욱 커지고 있습니다.
식물의 키와 과실 크기 같은 기본 형질은 물론이고, 광합성 효율, 당도(Brix), 병 저항성까지 모두 표현형 데이터에 포함됩니다.
과거에는 사람이 직접 눈으로 측정하고 기록했다면, 이제는 카메라와 AI를 활용해 대규모 데이터를 자동으로 분석하는 표현체학(Phenomics)의 시대로 이동하고 있습니다.
그리고 이 디지털 농업의 성패를 좌우하는 핵심이 바로 ‘정밀 데이터 라벨링’입니다.
“Garbage In, Garbage Out”
AI 성능은 결국 데이터 품질이 결정한다.
씨더스는 이번 실습에서AI 모델 성능이 결국 얼마나 정밀한 데이터를 학습하느냐에 달려 있다는 점을 강조했습니다.
AI 업계에서 자주 언급되는 “Garbage In, Garbage Out(GIGO)”이라는 말처럼,
학습 데이터 품질이 낮으면 아무리 뛰어난 AI 모델도 정확한 결과를 만들 수 없습니다.
최근 SAM3, DINOv3 같은 대형 영상 파운데이션 모델이 등장하며 자동 객체 분할 기술은 빠르게 발전하고 있지만, 농업 현장에서는 여전히 한계가 존재합니다.
범용 AI가 대략적으로 구분한 경계 오차가 실제 형질 측정에서는 치명적인 왜곡을 만들 수 있기 때문입니다.
실제로 씨더스는 범용 사전 라벨(Case A)과 전문가 보정 라벨(Case B)을 비교해
단 5% 수준의 면적 오차만으로도 바이오매스 평가 결과가 달라질 수 있다는 점을 실증했습니다.
즉, 농업에서는 단순 객체 인식을 넘어 도메인 지식이 반영된 정밀 품질 검수(QC)와 전용 라벨링 체계가 반드시 필요합니다.

씨더스가 제시한 표현체 분석 7단계 워크플로우
이번 실습에서 씨더스는 디지털육종 연구를 위한 표준 표현체 분석 워크플로우도 소개했습니다.
먼저 실험 설계 단계에서 처리구와 반복구를 과학적으로 구성하고, 일관된 조명과 각도 환경에서 RGB·다분광·초분광 데이터를 획득합니다.
이후 이미지 노이즈 제거와 ROI 추출 같은 전처리 과정을 거친 뒤, 잎과 과실, 병반 영역을 AI 기반으로 정밀 분할·검출합니다.
분할된 데이터에서는 면적, 높이, 색상, 개수, 3D 구조와 같은 형질 정보를 정량 추출하며, 최종적으로 머신러닝과 딥러닝 기반 분석을 통해 생리지표를 해석합니다.
분석 결과는 히트맵과 성장 곡선 형태의 대시보드로 시각화되어 연구자가 직관적으로 데이터를 이해할 수 있도록 구성됩니다.

씨더스 3S 솔루션 기반 라벨링 실습
실습 교육에서는 씨더스의 labeling 프로그램인 3S(Seeders Segmentation Solution)를 활용한 라벨링 실습도 함께 진행되었습니다.
씨더스는 연구 목적과 작물 특성에 따라 세 가지 방식의 라벨링 전략을 소개했습니다.
먼저 AI 자동 라벨링은 토마토나 사과처럼 형태가 비교적 명확한 작물 데이터를 빠르게 처리하는 방식입니다.
Semi-Auto 방식은 작업자가 일부 포인트만 지정하면 AI가 자동으로 외곽을 스케치해주는 구조로, 작업 효율을 크게 높일 수 있습니다.
마지막으로 Manual 라벨링은 병징 분석이나 저항성 평가처럼 전문가의 세밀한 판단이 필요한 경우 사용됩니다.
특히 경계가 모호한 복합 표현형까지 정밀하게 구분해 초고품질 Ground Truth 데이터셋을 구축할 수 있다는 점이 특징입니다.
토마토 단면 분석부터 머신러닝 통계분석까지
이번 실습에서는 단순 외부 촬영을 넘어 토마토 과실 내부 단면 분석까지 진행되었습니다.
교육생들은 토마토 내부의 과심(Columella), 자방(Locule), 내과피(Endocarp) 영역을 세부 라벨로 구분하고, 각 영역의 면적과 개수를 정량 계측했습니다.
또한 과실 면적뿐 아니라 줄기 길이와 각도 변화 같은 시계열 동적 형질 데이터까지 분석했습니다.
최종적으로는 추출된 데이터를 기반으로T-test와 U-test를 활용한 정규성 검정과 처리구 비교를 수행했으며,
PCA, PLS-DA, ROC-AUC Curve, Confusion Matrix 등 머신러닝 기반 고급 통계 분석 기법까지 실습이 이어졌습니다.
단순 계측을 넘어 AI 기반 예측 분석 인프라까지 직접 경험한 셈입니다.

디지털 육종의 혁신을 선도하는 씨더스
이번 국립원예특작과학원 표현체 교육은 씨더스가 보유한 데이터 핸들링 역량과 컴퓨터 비전 기술을 연구 현장과 공유한 의미 있는 자리였습니다.
씨더스는 앞으로도 표현체 데이터 구축, AI 모델 설계, 디지털육종 인프라 구축 분야에서 현장과 연구를 연결하는 역할을 계속 확대해 나갈 계획입니다.
주관적 관찰을 정량 데이터로 바꾸는 기술.
그리고 그 데이터를 다시 AI 기반 의사결정으로 연결하는 기술을 통해 디지털육종 시대의 농업 혁신을 선도하는 씨더스가 되겠습니다.
DATA IS REAL
씨더스는 데이터와 AI로 더 건강한 먹거리를 제안하는 기업입니다.
'SEEDERS STORY' 카테고리의 다른 글
| 표현체와 AI의 만남, 디지털 육종 시대의 시작 (0) | 2026.05.14 |
|---|---|
| 유전체와 AI의 만남, 디지털 육종 시대의 시작 (0) | 2026.04.24 |
| 에이전틱 AI 시대 시작, 씨더스가 합류한 AI 얼라이언스 현장 (1) | 2026.04.20 |
| 미래 농업의 심장, 농촌진흥청 슈퍼컴퓨팅센터와 씨더스의 만남 (1) | 2026.04.10 |
| 미래 농업을 잇는 기술, 씨더스의 AI 기반 표현체 분석 솔루션 이야기 (1) | 2026.04.09 |

