인공지능 특허 작성 팁에 대해서 써보려고 합니다. 특허 명세서의 작성, 특히 청구항의 작성은 모든 변리사들이 명세서 작성에 가장 많은 시간을 들이는 부분에 해당합니다. 인공지능 분야가 산업계에 전방위적으로 적용되고 있는 상태이기 때문에 인공지능 분야의 특허 명세서를 작성하는 방법에 대해서도 변리사들의 고민이 많습니다.

특허의 청구범위를 작성할 때에는 심사 측면과 등록 후의 권리 행사 측면을 동시에 고려해야 합니다. 심사 측면을 고려할 경우에 구성이 많을 수록 등록 진보성이 인정될 확률은 높아지고 등록 가능성도 함께 상승하게 됩니다. 하지만, 권리 행사 측면을 고려할 경우에는 구성이 많을 수록 침해의 입증에는 불리해 집니다.
몇몇 변리사님은 짧은 청구항에 최고라는 말씀도 하십니다. 적은 구성을 가진다는 말은 반대로 넓은 권리범위를 가진다는 말과도 일맥상통합니다. 따라서, 청구범위는 등록가능한 한도 내에서 가장 적은 구성을 갖도록 작성하는 것이 이상적입니다.
특허청에서는 모범 명세서 작성 방법을 제공하고 있는데요. 이는 구체적인 발명 분야에 따라 크게 달라질 수 있기 때문에, 오늘은 그 구체적인 분야로 인공지능 분야를 설명해 보고자 합니다.
인공지능 특허 명세서 작성 팁
1. 인공지능 특허의 특징
아래의 관련 포스팅에서도 설명했듯이 인공지능에서의 특허 포인트는 크게 3 가지 정도로 볼 수 있습니다. 첫 번째는 데이터, 두 번째는 뉴럴 네트워크의 구조, 세 번째는 뉴럴 네트워크의 학습 과정으로 볼 수 있습니다.
(1) 데이터
자율주행 분야와 Chat GPT의 경우에도 알 수 있듯이, 인공지능 분야에서 매우 중요한 것 중에 하나는 학습 데이터의 확보입니다. 데이터 측면에서도 다양한 특허 분야가 존재할 수 있습니다. 예를 들어, 데이터 augmentation, 데이터의 전처리, 라벨링 등의 특허가 여기에 해당될 수 있습니다. 이는 딥러닝 모델에 입력 또는 출력되는 데이터 또는 데이터의 처리 과정 자체에 특징이 있는 경우에 해당합니다.
(2) 뉴럴 네트워크 모델 구조
뉴럴 네트워크의 모델 구조 그 자체에 특징이 존재하는 경우입니다. 초기의 머신 러닝 연구에서와 같이 시계열 데이터를 처리하는 RNN이나 이미지 처리를 위한 CNN과 같이 새로운 네트워크 구조를 개발한 경우라면 이것이 특허의 대상이 될 수 있습니다. 요즘에는 CNN, RNN의 기본적인 네트워크 구조를 사용하는 기술은 없기 때문에 상당히 드문 특허에 해당합니다.
하지만, 여전히 다양한 목적에 특화된 전용 네트워크를 구성하고자 하는 연구가 이루어지고 있습니다. 이런 연구에는 기존 네트워크의 변형이나 결합도 추가됩니다.
특허에서도 기존의 네트워크 구조를 변경하거나 추가하여 특별한 효과(예를 들어, 성능의 향상이나 학습 또는 추론 속도의 개선)가 있는 경우에는 특허의 대상이 될 수 있습니다.
(3) 학습 방법
학습 방법의 특허 포인트는 딥러닝을 통해서 뉴럴 네트워크를 구성하는 파라미터(또는, weight)를 업데이트 하는 방식이 얼마나 특별한 것인 지에 의해 결정됩니다. 예를 들어서, 새로운 손실함수의 개발이나, 복수의 서브 네트워크가 존재 하는 경우에 학습 순서의 조절이나, 학습 과정을 경량화하기 위한 quantization, pruning 등의 기술이 여기에 해당할 수 있습니다.
2. 인공지능 특허의 청구항 작성
(1) 소프트웨어 특허의 등록 요건
위의 특허 포인트들을 참고하여 청구항을 작성하는데 있어 가장 중요한 측면을 꼽자면, 그것은 위의 특징적인 구성들이 수행되는 하드웨어의 특정입니다.
현행 특허법 상 소프트웨어 발명은 하드웨어와 결합한 형태로 기술되어야 만 특허의 대상이 됩니다. 국가별로 차이는 있지만, 세계 최대 특허 강국인 미국도 이와 유사한 방식으로 특허의 대상을 한정하고 있는 상태입니다. 이에 따르면, 인공지능 특허도 특정한 하드웨어에 의해서 수행되는 데이터 처리 동작을 기술해야만 특허 등록이 가능합니다.
따라서, 어떤 하드웨어에서 인공지능 소프트웨어가 어떤 동작을 하는 것인지를 결정하는 것이 중요합니다.
(2) 학습과 추론의 주체를 고려
일반적으로, 인공지능 발명은 뉴럴 네트워크 모델을 학습하는 과정과 추론하는 과정이 시간적으로 분리되어 수행됩니다. 물론, 경우에 따라 실시간으로 학습을 수행하는 경우가 존재하기는 하지만, 이런 특허의 경우에는 해당 학습이 일어나는 하드웨어를 그 청구항의 카테고리로 기재하면 됩니다.
다만, 위에서 설명한 일반적인 경우와 같이 학습은 고성능 서버 컴퓨터에서 이루어지고, 학습을 통해 결정된 뉴럴 네트워크 모델 파라미터들을 단말과 같은 저사양 하드웨어로 전송하여 단말 측면에서는 추론 동작만 이루어지는 경우가 문제가 됩니다.
학습과 추론이 서로 다른 하드웨어에서 수행된다면 청구항의 구성도 분리되어야 합니다. 왜냐하면, 서버에서 벌어지는 학습 과정이 청구항에 기재될 경우에 이에 대한 침해 입증이 매우 어렵기 때문입니다.
우리가 사용하는 최종 프로그램에는 학습된 결과 만이 남아 있지 그 과정은 드러나지 않습니다. 예를 들어, Chat GPT의 경우에도 일반 사용자들은 대규모의 데이터를 이용하여 학습된 결과만을 웹으로 이용할 뿐 입니다.
따라서, 네트워크 모델 구조나, 데이터에 특허 포인트가 있는 발명의 경우에는 추론의 관점에서 청구항을 작성하는 것이 중요합니다.
다만, 학습 방법 그 자체에 특허 포인트가 있는 경우에는 추론 단말의 입장에서 기술하는 것이 불가능합니다. 이 경우에는 서버에서 수행되는 학습 동작을 기술하되, 외부에서 충분히 역추적이 가능한 입/출력 데이터들을 중심으로 청구항을 작성하는 것이 중요합니다.
구체적인 기술 방법은 발명에 따라 매우 상이하기 때문에 다음 번에 기회가 된다면 실제 특허 명세서를 바탕으로 설명하도록 하겠습니다.