Попередній
Випробуйте стандартний робочий процес програми для керування PhotoRobot
PhotoRobot представляє, як розробляти підказки штучного інтелекту для створення власних фонів фотографій продуктів для роботизованих зображень.
Використання штучного інтелекту для створення фотофонів продуктів є одним із способів покращити фотографію PhotoRobot, зняту роботом. У той час як PhotoRobot здатний автоматично видаляти фон з фотографій продуктів, інструменти штучного інтелекту можуть замінювати фон з точністю до бренду. Візьмемо, наприклад, заміну точного видалення фону PhotoRobot на фон, який візуально демонструє репутацію продукту.
Це може бути колірна гамма, яка доповнює сам бренд, або повноцінна 3D-сцена, на якій розміщується продукт. Фоном може бути білий мармур з прожилками, насичений пурпурно-червоний оксамит, рубіново-червоний шовк або інші розкішні фактури. А ще краще те, що деякі фони продуктів можуть ілюструвати фактичні компоненти товару, як-от інгредієнти, характерні для парфумів.
У цьому випадку інструменти штучного інтелекту можуть значно заощадити час на пошук та агрегацію всієї необхідної інформації про продукт, особливо якщо її немає під рукою. Потім команди можуть використовувати цю інформацію під час розробки зображень зі штучним інтелектом для створення фону, який відповідає конкретному бренду та продукту. Чому б не переконатися в цьому самому нижче? Дізнайтеся, як студії на основі PhotoRobot використовують інструменти штучного інтелекту для покращення фону продукту та впровадження в робочі процеси студійного виробництва.
Створення чудових фотографій продукту за менший час і з меншими зусиллями залишається наріжним каменем місії PhotoRobot. Це вірно навіть тоді, коли ШІ може створювати фотореалістичні зображення продукту виключно з текстових підказок. Відправною точкою залишається справжнє, якісне фото товару. Тоді штучний інтелект може збагатити історію навколо себе.
Таким чином, досягнення в галузі сучасного штучного інтелекту лише розширюють набір інструментів PhotoRobot. Ця технологія також плавно інтегрується в автоматизовані робочі процеси фотозйомки. Завдяки передовій оперативній розробці штучний інтелект може прискорити потік продукції в студії та покращити реальні зображення продукту, які ми знімаємо роботом. Роботизована зйомка забезпечує високу якість, необхідну для зображення продукту. Він також функціонує для створення фотографій, які є більш сумісними для покращення за допомогою інструментів генерації зображень.
Наприклад, використання світлодіодного освітлення з низьким CRI дозволяє отримати фотографії, де відсутня частина колірного спектру. Це призводить до критичних проблем для генераторів зображень зі штучним інтелектом, які не можуть відтворити те, чого немає. Однак PhotoRobot забезпечує ідеальне освітлення, видалення фону та постобробку фотографій для ефективної роботи за допомогою штучного інтелекту. Отримані зображення потім є оптимальними для додаткових удосконалень, таких як заміна фону або повна інженерія 3D-сцени.
Навіщо взагалі робити реальні фото, якщо ШІ може генерувати зображення товару? Звичайно, для маркетингу деяких продуктів реальні фотографії не завжди потрібні. Однак глибший розгляд зображень, створених штучним інтелектом, часто виявляє недоліки. Ось чому вони, як правило, корисні лише в обмеженому застосуванні.
Найпоширенішими проблемами, які виникають із фотографіями продуктів зі штучним інтелектом, є дивна типографіка та незначні помилки в деталях. Це не так погано, як бачити руки з шістьма пальцями, але все одно помітно.
Штучний інтелект зазвичай спотворює розміри, при цьому не виправдовуючи очікування якості, або іноді не відповідаючи рекламі та реальному товару. Це може викликати як етичні, так і юридичні питання, підтримуючи аргументи на користь збереження інвестицій у реальну продуктову фотографію.
Для багатьох компаній підходящим залишається виготовлення фотографій товару на чисто білому фоні або прозорому фоні. Насправді, більшості клієнтів PhotoRobot потрібне лише точне видалення фону.
Однак деякі лінійки продуктів просто вимагають більш якісного зображення продукту. Подумайте про дизайнерські та люксові бренди з надзвичайною репутацією – Armani, Apple, Louis Vuitton, Rolex. Таким компаніям потрібні професійні фотографії для друку в журналах і розміщення реклами на білбордах. Це, а також зображення для інтернет-реклами та сторінок товарів. У будь-якому випадку предмет повинен залишатися в центрі уваги на фотографіях. Однак фон також може функціонувати для привернення уваги до реклами та для того, щоб відрізнити продукт від продукту конкурентів.
Фон може збігатися з колірною гамою самого бренду або підкреслювати матеріал, текстуру та дизайн речі. Візьмемо, наприклад, додавання тіньових тонів на задній план, щоб висвітлити срібло, золото та інші яскраві або світловідбиваючі вироби. Такі фони часто популярні на фотографіях дизайнерських наручних годинників, сонцезахисних окулярів, колекцій ювелірних виробів та інших предметів розкоші. Хоча, першочерговим завданням фону залишається доповнювати предмет, а не відволікати від нього.
У більшості випадків метою зображення продукту є перенесення реального об'єкта в цифровий світ. При цьому об'єкт повинен залишатися правдивим, інформативним і привертати увагу.
Великі бренди часто роблять це, інвестуючи у високорозвинені моделі 3D-продуктів і конвеєри рендерингу 3D-моделей. Таким чином, активи стають більш захоплюючими, а предмети також легко розміщувати на будь-якому фоні продукту. 3D-візуалізація також дозволяє компаніям демонструвати змінні, рухомі або інтерактивні конфігурації продуктів. Візьмемо, наприклад, вбудовані 3D-моделі PhotoRobot, які використовуються на платформах хостингу 3D-моделей, таких як наша давня Emersya.
Незважаючи на це, очі експертів можуть відрізнити справжню фотографію від 3D-візуалізації. Те ж саме стосується зображень, повністю згенерованих штучним інтелектом. Автентичності просто не вистачає, іноді в різних аспектах, які людське око легко розрізняє. У деяких випадках це обмежує життєздатність. Хоча це не означає, що 3D-рендерам і генерації зображень зі штучним інтелектом взагалі немає місця в предметній зйомці.
У PhotoRobot цілі залишаються незмінними – автентичні фотографії з швидшими, простішими та масштабованішими виробничими процесами.
Незважаючи на швидкий прогрес у генераторах зображень на основі штучного інтелекту, PhotoRobot залишається швидшим і надійнішим рішенням із більшою віддачею від інвестицій. Немає жодних занепокоєнь щодо стабільності чи якості результатів, тоді як надійність та вірність є гарантією.
Під час використання штучного інтелекту в робочих процесах на основі PhotoRobot є низка областей, де штучний інтелект досягає успіху.
Наприклад, одним із варіантів використання може бути фотографування колекції парфумів для клієнта. Однак уявіть, що студія має під рукою лише продукти, з обмеженою інформацією про продукт. Саме тоді підказки штучного інтелекту можуть легко отримувати відповідні дані, автоматично каталогізувати їх і надавати структуровані метадані про елементи.
Потім студії можуть прикріплювати дані до зображень клієнта та використовувати інформацію під час заміни точного видалення фону PhotoRobot. Це може бути створення фону, який буде більш репрезентативним для бренду клієнта або продукту за його репутацією.
Для демонстрації нижче наведено реальний приклад фотографування серії парфумів Armani Privé у студії PhotoRobot. Фактичний флакон парфумів доступний у студії, але детальних метаданих із продуктом немає.
У цьому випадку підказка штучного інтелекту може агрегувати відповідну інформацію про продукт у структурований набір даних для перегляду. Крім того, можна отримати дані про кожен предмет у повній колекції ароматів.
Підказка може отримати назву аромату, назву колекції та код EAN для кожного товару. Потім він може містити інструкції для створення даних у двох форматах, наприклад: звичайний файл TXT і структурована таблиця CSV.
Щоб отримати список продуктів, ми спочатку запитуємо штучний інтелект, описуючи проєкт. У запиті також має бути вказано інформацію, яку потрібно отримати, і спосіб форматування результатів. (Примітка: Наступний приклад оперативного проектування штучного інтелекту та реальних виходів датовані травнем 2025 року. Майте на увазі, що вивід буде відрізнятися на різних платформах, а також у міру розвитку технології разом із робочими процесами PhotoRobot.)
Запит "отримати список продуктів":
Я створюю структурований набір даних парфумів для використання в середовищі предметної фотографії та автоматизації штучного інтелекту.
Будь ласка, створіть повний огляд колекції ароматів лінії парфумів Armani Privé, згрупований за колекціями (наприклад, Les Eaux, La Collection, Les Terres Précieuses, Les Mille et Une Nuits, Kogane Collection тощо).
Для кожного парфуму надайте:
1. Назва аромату
2. Назва колекції
3. EAN Code – міжнародний штрих-код для стандартної пляшки об'ємом 100 мл
Виведіть результат у двох форматах:
- Простий, читабельний список файлів TXT, згрупованих за колекціями (для довідки людині).
- Структурована таблиця CSV зі стовпцями: Collection, Fragrance, EAN.
- Підготуйте файли для безпосереднього завантаження.
Включайте лише парфуми, які існують в офіційній лінії Armani Privé. Якщо існує кілька EAN для аромату, надайте стандартну версію 100 мл (або найближчу з доступних).
Не додавайте маркетингову мову або описи — використовуйте лише структуровані, фактичні дані.
Наведений вище запит надає як звичайний файл TXT, так і структуровану таблицю CSV. Він містить структурований огляд повної колекції парфумів з назвами, групами та кодами EAN:
Це економить години ручної роботи для студії. Це, або непотрібні туди-сюди, а іноді й затримки комунікації між студією та замовником або постачальником.
Після зйомки зображень за допомогою PhotoRobot – з чистим фоном і оптимальним освітленням – можна ще більше покращити їх за допомогою штучного інтелекту. Для цього PhotoRobot легко інтегрує PhotoRoom через API в систему управління PhotoRobot. Це дозволяє:
Якщо піти ще далі, то візуальний сторітелінг можливий через фон продукту кількома способами, де штучний інтелект може допомогти. Візьмемо, наприклад, візуалізацію ключових інгредієнтів аромату навколо кожного флакона парфумів.
Щоб знайти візуалізовані інгредієнти, характерні для кожного парфуму, потрібна більш описова підказка штучного інтелекту. Запит має містити результати, які включають ключові примітки, візуальні теми та елементи дизайну для кожного елемента. Ця інформація допоможе в подальшому оперативному інжинірингу згенерувати фонові зображення, які точно відповідають бренду і продукту.
Візьмемо, наприклад, наступну підказку. Ми починаємо з опису проекту та прикріплюємо вихідний CSV з першого підказки.
I am preparing a detailed dataset for building a mood board or artistic representation. The dataset must provide structured data to generate visual representations of perfumes using AI. Please provide a detailed CSV table for the perfumes in the following file:
- 2_armani_prive_overview_ean.csv (the output from prompt 1)
Select perfumes only in the dataset:
- La Collection
For each perfume, create the following columns:
1. Fragrance – The name of the perfume
2. Top Notes – Tangible, visualizable ingredients (e.g. flowers, resins, peels)
3. Heart Notes – Tangible, visualizable ingredients
4. Base Notes – Tangible, visualizable ingredients
5. Visual Themes – A short phrase describing the atmosphere and textures the perfume evokes (for artistic use, e.g. “stone walls, golden light”)
6. Bottle Design – A detailed description of the perfume bottle: color and material of the body, shape, color of the cap, and label
Also, keep all ingredients and design details clearly worded for use in image generation. Take for example: resins, woods, herbs, spices, flowers, fruits, leaves, roots, smoke, or textures – e.g., dry, mineral, creamy. Exclude abstract terms like “elegant”, “sophisticated”, or “sensual”. Focus on concrete visual elements like “black glass”, “gold plate label”, “ivory stone cap”, etc.
Additionally, briefly list the main visual themes or textures the perfume evokes (e.g. "golden glow", "stone walls", "church incense", "earthy forest", etc.) — anything useful for background styling or setting a graphic mood.
Prepare a CSV structure that will later be used to generate visual prompts for AI image models like DALL·E. Please format the output clearly and in full.
Наведений вище запит призводить до детальної таблиці інгредієнтів до специфікації у форматі файлу CSV.
Наприклад, результати підказки включають наступне для першого парфуму.
Тоді другий парфум має свої результати, які є специфічними для цього виробу.
Ці структуровані дані про всі парфуми в колекції нададуть інформацію, необхідну для початку створення візуальних підказок.
З візуалізованим списком інгредієнтів наступним етапом є розробка візуальних підказок для генераторів зображень. Для цього ШІ може створити нову колонку «Візуальна підказка» для кожного окремого парфуму в CSV. Однак для цього потрібні дуже детальні інструкції в новому запиті. Спочатку це починається із завантаження візуалізованого списку інгредієнтів, а потім опису проекту. Потім запит має включати кілька рівнів певних команд. Команди охоплюють вимоги до підказок, поширені помилки, яких слід уникати, обмеження, такі як у типографіці, і вивід, а також очікування якості.
Перший рівень підказки прикріплює файл CSV для аналізу та надає загальні інструкції щодо завдання.
Вам буде надано файл CSV, що містить структуровані дані про парфуми з колекції Armani Privé La. У кожен ряд входять:
- Аромат (назва парфумів)
- Верхні ноти (чітко візуалізуються інгредієнти)
- Ноти серця (чітко візуалізовані інгредієнти)
- Базові ноти (чітко візуалізовані інгредієнти)
- Візуальні теми (атмосфера та текстури, які викликає парфум)
- Дизайн пляшки (матеріал, колір, форма, етикетка та кришка)
- EAN (використовується як ім'я файлу зображення)
Ваше завдання — згенерувати новий стовпець під назвою «Візуальний запит», який містить повний і прямий запит для інструментів генерації зображень зі штучним інтелектом (наприклад, DALL· E або Midjourney).
Другий рівень запиту визначає вимоги до кожного нового елемента в новому стовпці файлу CSV.
У кожному запиті має бути описано, як перетворити фотографію товару парфумів (під назвою {EAN}.jpg) на кінцеве зображення з такими властивостями:
По-третє, у запиті названі конкретні обмеження та поширені помилки, яких слід уникати.
Не згадуйте CSV і не описуйте структуру. Пишіть кожну підказку так, ніби звертаючись безпосередньо до штучного інтелекту, щоб згенерувати зображення для цього парфуму.
Результат має виглядати преміальним, атмосферним і відповідати ідентичності аромату. Вона має відрізнятися від професійно відретушованої редакційної фотографії, але повністю згенерована штучним інтелектом. Глядач не повинен бути в змозі визначити, що зображення є синтетичним.
Також не варто згадувати і показувати штучну генерацію. Зображення має виглядати автентично та фотореалістично.
У четвертій частині підказки діляться інструкціями по роботі з цими специфічними флаконами парфумів. Типографіка є поширеною проблемою для штучного інтелекту, тому дуже важливо надавати дуже чіткі інструкції щодо дизайну етикеток, брендингу та стилю.
Pay special attention to the design of the front label on the bottle and its graphics accuracy. The gold plate must include the following exact text, as the original image, centered and aligned as on the real product.
- The slash symbol (" / ") between ARMANI and PRIVĒ is slightly taller than other letters and subtly stylized. It starts slightly below other characters, and ends slightly above the other characters, as on the original image.
- The character "Ē" in PRIVĒ must have a clearly visible horizontal accent mark, while the letter including the accent mark is the same height as other letters. There is a flat horizontal line above it (not an acute line). The line must be the same width as the E below it, not slanted. It must not resemble an É. This is not a diacritic or an accent – it is a flat macron (horizontal bar). In other words, the horizontal line on Ē must resemble a short flat line, like a hyphen, placed precisely above the E. It must not be diagonal like in É.
- Match the exact label design from the reference product photo.
- The label must be identical in typography, spacing, and accents. The label must be the same visual style as the original image, as it is crucial to the brand identity.
- The typography must be accurate and not estimated or replaced. Caution: the typography may be changed for a single character, so follow the details for each character individually.
- Do not change, shorten, or paraphrase any part of the label.
Останній шар підказки продовжує відображати очікування для кожного візуального запиту та містить інструкції для нового CSV.
Пластина пляшки повинна зберігати свою пропорцію, обробку поверхні, виглядати тисненим принтом при м'якому освітленні.
Ця етикетка критично важлива для бренду – ставтеся до неї з такою ж візуальною точністю, як до логотипу чи торгової марки.
Форма пляшки має вирішальне значення для бренду – ставтеся до неї з такою ж візуальною точністю, як до логотипу чи торгової марки.
Не змінюйте текст і не наближайте шрифт – ставтеся до цієї етикетки як до критично важливого для бренду елемента дизайну, який повинен бути точним і чітким.
Етикетка повинна зберігати свої реалістичні пропорції, текстуру та золоте покриття – вона злегка тиснена м'яким атласним блиском під м'яким світлом.
Збережіть результат у новому файлі CSV з усіма вихідними стовпцями та новим стовпцем "Візуальний рядок".
Зрештою, отримана таблиця CSV містить повний список парфумів, назви, EAN, візуалізовані інгредієнти та візуальні підказки. Візуальні підказки містять повні та прямі підказки для інструментів генерації зображень зі штучним інтелектом, таких як DALL· Е і Midjourney. Вони допоможуть створити власні фони та сцени, які творчо доповнять реальні фотографії флаконів парфумів.
Після створення візуальних підказок для кожного елемента ваш улюблений генератор зображень зі штучним інтелектом може зробити все інше. Все, що для цього потрібно, це завантажити зображення, зроблені PhotoRobot, і ввести візуальні підказки з CSV для створення власного фону. Генератор виконає рендеринг фону відповідно до оперативного інжинірингу, а також для рендерингу в різних стилях.
Тим часом, зображення продукту PhotoRobot з точним видаленням фону дозволяють легко міняти фон всередину та ззовні. Якщо один з них не збігається ідеально, ваші команди із забезпечення якості можуть швидко створити той, який працює. Або запропонуйте генератору штучного інтелекту відрегулювати вихідні дані до задовільного стану.
Нарешті, якщо розширити межі генерації фону за допомогою штучного інтелекту, можливий навіть повний рендеринг 3D-сцени. Однак це виходить далеко за рамки більш простого обміну фоном. Уявіть, що ви демонструєте фантастичне 3D-середовище з точними краєвидами на додаток до ключових інгредієнтів. Для цього потрібна набагато амбітніша підказка.
Щоб згенерувати повноцінну 3D-сцену для одного з флаконів парфумів, необхідна ще одна складна підказка. Він повинен враховувати композицію сцени, візуальні теми, атмосферні елементи, колірну палітру, освітлення та інше. Візьмемо, наприклад, наступну підказку.
Завантаживши зображення продукту в ШІ, запустіть підказку генератора, перерахувавши всі вимоги до фонової сцени. Це включатиме інформацію про продукт із наочного списку інгредієнтів та візуальні підказки.
Створіть всю сцену, включаючи фон, інгредієнти, текстури та художнє освітлення в гармонії з дизайном пляшки.
Склад сцени:
Створіть елегантну атмосферу в редакційному стилі навколо пляшки, використовуючи:
Додайте атмосферні ефекти переднього плану, такі як дим або туман, якщо частина нот, частково перекриваючи пляшку для реалістичності. Зберігайте візуальну рівновагу, глибину та витонченість.
Зберігайте перспективу в студійному стилі та кут нахилу камери.
Далі вкажіть критичні інструкції для графічної точності етикетки та пляшки. Це ті ж команди, що і в візуальних підказках для зовнішнього вигляду кожного окремого предмета. Інструкції стосуються точності типографіки, дизайну етикеток, графіки та використання оригінальних фотографій.
Нарешті, надішліть штучному інтелекту всі остаточні вимоги до зображення з візуальної підказки окремого елемента. Це включає копіювання тих самих інструкцій, що й раніше, щодо пропорцій, обробки, тисненого друку та освітлення. У них перераховані конкретні вимоги до якості етикетки, форми пляшки, тексту, типографіки та додаткових елементів дизайну. Зрештою, кінцевий результат має набути форми повноцінної 3D-сцени позаду елемента, яка залишається в центрі уваги.
Оцініть отриману 3D-сцену для фону продукту парфумів самостійно.
Примітка: У цьому випадку немає можливості повністю інтегрувати реальну фотографію в 3D-світ. Це необхідно, щоб генератор штучного інтелекту замість цього перефарбував предмет у цифровому вигляді, щоб помістити його в 3D-сцену. У цьому випадку є різні обмеження, наприклад, немає справжньої багатошарової композиції, як у Photoshop. Крім того, залишаються проблеми з типографією зі складними символами. Тим не менш, подібні проблеми не завжди будуть існувати і можуть вирішитися рано чи пізно в міру розвитку технологій.
По суті, поєднання автоматизованої фотографії та інструментів штучного інтелекту може значно збагатити клієнтський досвід у вашому портфоліо. Незважаючи на те, що основа залишається реальною фотографією високої якості, штучний інтелект може розширити розповідь навколо неї. Технологія підтримує тематичну візуалізацію і може служити для значного прискорення робочих процесів фотостудії. Це забезпечує швидке джерело та синтез інформації, автоматичну каталогізацію та ефективний обмін даними (зі знаннями оперативного проектування). Щоб дізнатися більше, команда PhotoRobot завжди готова допомогти бізнесу реалізувати своє творче бачення. Просто запитайте, як ми можемо допомогти. Ваш проект може навіть з'явитися в майбутніх публікаціях блогу - якщо не секретний робочий процес, що ретельно охороняється, звичайно!