I built a textile pattern generation API because PatternedAI has no API

개요

PixelAPI는 PatternedAI와 같이 GUI 중심의 텍스타일 패턴 생성 도구에 API 부재로 인한 시장 공백을 해결하기 위해 구축된 REST API입니다.

주요 내용

* API 기능: 8가지 스타일, 512px 또는 1024px 출력, 색상 변경 및 업스케일 기능, 완벽하게 반복 가능한(seamless tileable) 패턴 생성 기능을 제공합니다.
* 가격 경쟁력: 패턴당 $0.008로, 기존 GUI 기반 서비스 대비 2~5배 저렴한 가격으로 제공됩니다.
* 다양한 생성 모델: Floral, Geometric, Ikat, Paisley, Tribal, Animal-print, Abstract 등 각기 다른 특성을 가진 패턴 생성을 위해 PatternDiffusion 및 SDXL-seamless와 같은 모델을 활용합니다.
* "Stripes" 알고리즘 개발: 일반적인 AI 모델이 깨끗하고 일관된 줄무늬 생성을 어려워하는 문제를 해결하기 위해 Pillow 라이브러리를 활용한 10줄의 코드로 이루어진 알고리즘을 개발하여 10/10 품질의 결과를 10ms 만에 생성하도록 구현했습니다.
* 품질 관리(QC) 시스템:
* Pass-through detection: 입력과 출력이 픽셀 단위로 동일할 경우 거부합니다.
* Scene-destruction detection: 편집 작업 시 35% 이상의 픽셀 변경이 발생할 경우 거부하여 과도한 이미지 변형을 방지합니다.
* VLM verification: Qwen2.5-VL-7B 모델을 사용하여 입력, 출력, 프롬프트를 비교하여 결과의 품질을 판별합니다.
* 반복 개선: QC 실패 시 최대 5번까지 프롬프트 전략 또는 대체 모델을 사용하여 재시도하며, 실패 시 자동으로 크레딧을 환불합니다.
* 현실적인 개발 이슈:
* 스타일 중복: PatternDiffusion이 "geometric" 요청에 대해 "tribal" 스타일로 치우치는 경향이 있어 프롬프트에 "minimalist scandinavian" 또는 "two-tone"과 같은 키워드를 추가하는 워크어라운드를 사용합니다.
* 로마자 비영어 프롬프트: 언어 감지 기반 번역기가 로마자 표기된 비영어 프롬프트를 인식하지 못해 결과에 영향을 줄 수 있습니다. QC 시스템이 이를 감지하고 환불하지만 5분 정도의 시간 손실이 발생합니다.
* 단일 문자 모티프 요청: 이 API는 단일 큰 모티프 요청보다는 일반 이미지 생성 API(/v1/image/generate)에 적합합니다.
* 가격 모델: 종량제(Pay-per-use) 방식으로, 인당 라이선스, 월 최소 요금, 30일 폐기 정책 등이 없습니다.
* 체험 제공: 가입 시 100개의 무료 크레딧을 제공하여 API의 유효성을 검증할 수 있도록 합니다.

시사점

PixelAPI는 AI 기술이 모든 문제를 해결하는 만능 열쇠가 아님을 보여주며, 특정 작업에 대해서는 알고리즘 기반 접근 방식이 더 효율적이고 정확할 수 있음을 시사합니다. 또한, 강력한 품질 관리 시스템을 통해 사용자에게 신뢰할 수 있는 서비스를 제공하고, 투명한 가격 정책과 무료 체험을 통해 API의 실질적인 가치를 검증할 기회를 제공합니다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions