Главная / Библиотека / Сравнительный анализ методов спектроскопии в сочетании с алгоритмами машинного обучения для исследования дубовых бочек для выдержки вин

Сравнительный анализ методов спектроскопии в сочетании с алгоритмами машинного обучения для исследования дубовых бочек для выдержки вин

Теги avantes спектроскопия отражения флуоресцентная спектроскопия
Сравнительный анализ методов спектроскопии в сочетании с алгоритмами машинного обучения для исследования дубовых бочек для выдержки вин

Аннотация: Древесина дуба широко используется в производстве бочек для выдержки вин, поскольку обладает особыми физическими, химическими и структурными свойствами. При контакте с вином данный вид древесины непрерывно выделяет в жидкость ароматические соединения, такие как лигнин, танин и целлюлоза. Однако, со временем в процессе выдержки древесина дуба теряет характерные ароматические соединения; соответственно, вкусовые качества, придаваемые вину, становятся менее насыщенными при повторных доливках жидкости, и требуется замена бочки. Настоящее исследование представляет собой первый сравнительный анализ характеристик выдержки в дубовых бочках с помощью методов спектроскопии, результаты которого можно применять в винодельческой промышленности. 

Введение

Производство вина – это естественный сельскохозяйственный процесс, представляющий собой неотъемлемую часть европейской жизни и культуры. Качество вина как сельскохозяйственного продукта в значительной степени зависит от ряда параметров, связанных не с производственными, а с природными факторами. Качество и характеристики вина меняются от года к году и существенно зависят от таких параметров, как почва и погодные условия, характеристики урожая, качество винограда, среда брожения и процесс выдержки. Процесс выдержки, в частности, является решающим фактором, придающим вину неповторимый вкус и аромат. Во время выдержки вино обычно помещают в дубовые бочки, поскольку древесина дуба обладает определенными гидрофильными свойствами и выделяет в жидкость ароматические компоненты. В процессе выдержки происходит ряд реакций, в результате которых изменяется химический состав и органолептические свойства вина, определяющие его конечное качество. Древесина дуба способствует умеренному окислению вина и выделяет танин и ароматические соединения, такие как ванилин и изомеры лактона дуба, которые дополняют вкусовой профиль напитка. Данные соединения при контакте с вином придают жидкости желаемый вкус. В мире насчитывается более 600 различных видов дуба, однако только 3 вида подходят для изготовления винных бочек. После нескольких доливок вином бочки теряются свои ароматические свойства и не придают вину достаточного аромата и вкуса, однако забракованные бочки все равно можно использовать для других целей, например, в качестве хорошей альтернативы виноделы могут добавлять свежую дубовую стружку в вино, хранящееся в старых бочках. По результатам исследований использование дубовой щепы представляется удачным использовать при для производстве вин короткой выдержки. 

В настоящей статье описаны результаты использования методов спектроскопии, таких как измерение коэффициента отражения, флуоресценции и рамановская спектроскопия для описания свойств бочки между доливками. Эти методы спектроскопии используются для исследования количественной корреляции между содержанием химических соединений в древесине дуба, таких как танин и лигнин, отвечающих за вкус вина, и количеством доливок вина. Рамановская спектроскопия для обнаружения изменения содержания танина в сельскохозяйственных продуктах используется давно. Для классификации древесины дуба также используется спектроскопия ближнего инфракрасного диапазона (БИК).  Кроме того, методы хемометрии для обработки данных становятся все более востребованными в различных видах применения, таких как мониторинг окружающей среды, исследования пищевых продуктов и биофотоники, где требуется классификация целевых анализируемых компонентов. Использование алгоритмов хемометрии облегчает процесс классификации древесных пород и, следовательно, является действенным инструментом при изучении свойств дубовых бочек.

Материалы и методы

В статье приведены предварительные результаты спектроскопического исследования трех различных бочек из французского дуба: неиспользованных (без предварительного контакта с вином), однократно использованных (1 разлив) и двукратно использованных (2 разлива). Все образцы бочек были взяты на винодельне Diamantakis Winery, входящей в сеть Wines of Crete, которая была основана в 2006 году и на которую приходится более 95% производства вина в бутылках на острове Крит. Бочки были изготовлены на одном и том же производстве бондарных изделий (Tonnellerie Quintessence, Франция). Кроме того, во избежание возникновения дополнительной погрешности в ходе исследования, были взяты образцы дубовых бочек, использовавшихся для выдержки одного и того же сорта белого вина (Видиано, местный сорт острова Крит) в течение 3 месяцев за цикл выдержки. 

1. Спектроскопия отражения

Для выполнения измерений с помощью метода спектроскопии отражения использовалась интегрирующая сфера (AvaSphere-30, Avantes). Интегрирующая сфера собирала весь отраженный свет, исходящий от образца, независимо от поверхностного рассеяния или угла отражения (рисунок 1). Галогенный и дейтериевый источники света были соединены и освещали образец широкополосным светом, охватывающим ультрафиолетовую, видимую и ближнюю области спектра (200-2500 нм). Источник света был подключен к интегрирующей сфере с помощью оптоволоконного кабеля (FC-UVIR600-2, Avantes). Коллимационная линза (COL-UV/VIS, Avantes) была использована для обеспечения эффективного (>90%) соединения света с оптоволоконным кабелем и интегрирующей сферой. Образец освещался под углом 8°, при этом весь отраженный свет улавливался внутри сферы. Значение угла было выбрано с целью избежать обратных отражений. После отражения от внутренних стенок сферы, покрытой 98% отражающим спектралоном, второй оптоволоконный кабель (FCB-UVIR600-2, Avantes) направил свет на широкополосный анализатор спектра. Был выбран анализатор спектра с функцией измерения как ультрафиолетового, видимого, так и ближнего инфракрасного диапазона. Анализатор спектра состоял из спектрометра Avantes AvaSpec3684 (200-1100 нм, разрешение 1,4 нм) и спектрометра Avantes AvaSpec256 (1000-1700 нм, разрешение 4 нм). Программное обеспечение Avasoft 8 использовалось для расчета спектров отражения как отношения отраженного света образца и отраженного света эталона диффузного отражения Spectralon® (отражательная способность 99,9%) с поправкой на линейный спектр поглощения. Параметры измерений в УФ/Видимом спектре: время интегрирования 3,7 с, усреднение спектра за счет 2-кратного сканирования и 37 сглаживающих пикселей; параметры для измерений в БИК-спектре: время интегрирования 2,1 с, усреднение спектра за счет 2-кратного сканирования и 12 сглаживающих пикселей. Время интегрирования было выбрано таким образом, чтобы иметь наибольший динамический диапазон, избегая при этом цветовой насыщенности. Выбранное количество сглаживающих пикселей зависит от размера щели спектрометра и размера пикселей детектора.

Рисунок 1


Рисунок 1. Измерительная модель для спектроскопии отражения. (а) Установка, состоящая из широкополосных источников света, оптоволоконных кабелей, интегрирующей сферы и анализатора спектра, позволяет точно измерить спектр отражения образцов древесины дуба. (b) Схема экспериментальной установки. (c) Необработанные спектры отражения трех образцов древесины дуба. Скачок в данных спектров при длине волны 1000 нм обусловлен соединением двух анализаторов спектра. Пики при длинах волн 1200 нм и 1470 нм указывают на характерную связь целлюлозы, воды и лигнина

2. Флуоресцентная спектроскопия

Измерения с помощью метода флуоресцентной спектроскопии проводились с помощью источника света на длине волны 355 нм (рисунок 2а). Длина волны 355 нм была достигнута путем пропускания лазерного импульса длиной 710 нм сверхбыстрого Ti:S (титан-сапфирового) генератора системы "Tsunami" через кристалл, генерирующий вторую гармонику. Мощность лазера составляла 300 МВт. Такой мощности было достаточно для получения четких сигналов флуоресценции, в то время как лазер с более высокой мощностью мог сжечь образец древесины дуба. 

Рисунок 2

Рисунок 2. Установка для измерения с помощью метода флуоресцентной спектроскопии. (а) Экспериментальная установка. Лазер, детекторное волокно и анализатор спектра используются для регистрации слабой интенсивности флуоресценции образцов древесины дуба. (b) Схема. (c) Предварительные данные спектров флуоресценции трех образцов древесины дуба. Вершина графика на длине волны 390 нм представляет собой максимум автофлуоресцентного излучения лигнина

3. Рамановская спектроскопия

Измерения рамановской спектроскопии проводились с помощью рамановского конфокального микроскопа inVia™, Renishaw. Система оснащена двумя лазерами: твердотельным лазером с диодной накачкой мощностью 50 МВт при длине волны 532 нм, с воздушным охлаждением и регулируемым держателем для зеркала (включает полосовой фильтр для длины волны 532 нм) и диодным лазером мощностью 100 МВт при длине волны 785 нм, с воздушным охлаждением и регулируемым держателем для зеркала (включает полосовой фильтр для длины волны 785 нм), с дифракционными решетками 1800 линий/мм и 1200 линий/мм соответственно. Образец древесины был помещен под объектив Leica NPLAN 50 мм с большим рабочим расстоянием, числовой апертурой 0,75, диаметром 8,2 мм. Полностью автоматизированный предметный столик микроскопа использовался, чтобы контролировать на какой высоте находится образец и, соответственно, фокусировать свет на поверхности образца древесины дуба. 

4. Хемометрия

Хемометрию можно рассматривать как подмножество области машинного обучения, основанного на данных. Цель хемометрических измерений – извлечь информацию о химическом составе данных из результатов спектроскопических измерений. Для удаления нежелательных сигналов и повышения надежности результатов классификации, предварительные спектроскопические данные проходят первичную обработку. Эффекты рассеяния внутри твердых образцов, в результате появления которых длина оптического пути при одной и той же химической концентрации отличается, обычно устраняются с помощью стандартизации нормировкой вариации.  Каждый спектр корректируется путем вычитания среднего спектрального значения и деления на его спектральное стандартное отклонение. Сглаживание осуществляется путем применения фильтра Савицкого–Голея, который заменяет спектр полиномом небольшого порядка, подобранным с помощью дискриминантного анализа на основе метода проекции на латентные структуры. 

Метод главных компонент часто используется для устранения корреляции спектральных данных и преобразования их в пространство меньшей размерности с сохранением изменчивости (информации), присутствовавшей в необработанном входном сигнале. Вторым широко используемым методом линейной классификации является линейный дискриминантный анализ. Он предполагает многомерное нормальное распределение с разным средним значением, но одинаковой ковариацией для разных классов. Максимизируя апостериорную вероятность принадлежности к определенному классу, учитывая наблюдение, можно найти границу принятия решения.

Результаты и обсуждение

Спектры, полученные с помощью различных методов оптических измерений, были проанализированы с использованием вышеупомянутых классических хемометрических методов. Цель состоит в том, чтобы классифицировать и дифференцировать образцы дубовых бочек (классификация из трех классов), использованных различное количество раз, путем получения данных спектроскопии бочарных клепок и сопоставления этих данных с содержанием химических соединений, которые определяют качество вина.

1. Спектроскопия отражения

Было проведено 65 измерений образца неиспользованной бочки: 22 измерения в верхней части образца, 21 измерение в средней части образца и 22 измерения в нижней части образца; 84 измерения образца бочки, использованной однократно: 28 – в верхней части, 28 – в средней части, 28 – в нижней части; 68 измерений образца бочки, использованной двукратно: 22 – в верхней части, 23 – в средней части и 23 – в нижней части. Все измерения в равной степени затронули всю поверхность образца, как показано на рисунке 1.

В ходе анализа были рассмотрены две типичные полосы поглощения при длинах волн 1200 нм и 1470 нм (рисунок 1c). Поглощение на длине волны 1200 нм было связано в основном с содержанием целлюлозы (возможно, также лигнина) в древесине дуба (второй обертонный мод в области валентных колебаний связи C-H), в то время как поглощение на длине волны 1470 нм было связано с содержанием целлюлозы (первый обертонный мод в области валентных колебаний связи O-H), поглощенной воды и лигнина.

Для получения наилучших результатов классификации к данным измерения спектров были применены различные типы предварительной обработки данных. В статье рассматриваются пять методов предварительной обработки, которые обычно используются при работе с данными спектроскопии (диффузного) отражения, как описано в разделе 2.4: (1) Стандартизация нормировкой вариации; (2) первая производная с использованием фильтрации методом Савицкого-Голея с шириной окна сглаживания 11 точек и вторым порядком полинома; (3) вторая производная с использованием фильтрации методом Савицкого-Голея с шириной окна сглаживания 11 точек и вторым порядком полинома; (4) Стандартизация нормировкой вариации + первая производная; (5) Стандартизация нормировкой вариации + вторая производная. Следует отметить, что сглаживание было выполнено в программном обеспечении Avasoft 8 путем указания количества пикселей сглаживания.

Для разделения образцов на три различных класса были использованы две линейные хемометрические модели классификации. Первый метод, который был использован, – это дискриминантный анализ на основе метода проекции на латентные структуры. В качестве входных данных используется только БИК-часть спектров. Классы (выходные данные) представлены двоичным вектором: [1 0 0], [0 1 0], [0 0 1] для неиспользованной бочки и бочек, использованных однократно и двукратно, соответственно. Пороговое значение 0,5 используется для преобразования спрогнозированных непрерывных векторов обратно в двоичный вектор и метку класса. Количество используемых компонентов дискриминантного анализа на основе метода проекции на латентные структуры определяется путем пятикратной перекрестной проверки.

Второй метод, который был использован, – это линейный дискриминантный анализ. В модели использовалась объединенная полная ковариационная матрица. Линейный дискриминантный анализ был применен к БИК-диапазону спектров, к данным диаграммы рассеяния, а также к данным, преобразованным с помощью метода главных компонент. Точность классификации каждого из трех классов (в матрице несоответствия правильной модели большинство выборок будет находиться вдоль диагонали) используется в качестве метрики качества (таблица 1).

Таблица 1. Результаты классификации с помощью метода спектроскопии отражения. Оптимальное количество компонентов дискриминантного анализа на основе метода проекции на латентные структуры или метода главных компонент указано в скобках. Показатели точности валидации приведены в таблице, полученной с помощью повторной (вложенной) пятикратной перекрестной проверки. Ошибка представляет собой стандартную погрешность среднего значения, полученную при 10 различных повторных измерениях

Таблица 1

Дискриминантный анализ на основе метода проекции на латентные структуры, обученный во всем БИК-диапазоне, продемонстрировал наилучшие результаты, независимо от метода предварительной обработки. Как образец бочки, использованной однократно, так и образец бочки, использованной двукратно, были классифицированы с точностью >99% при повторной вложенной перекрестной проверке. Линейный дискриминантный анализ, обученный на всем БИК-диапазоне, продемонстрировал несколько худшие результаты, хотя точность >93% была достигнута. В данном случае метод первой производной продемонстрировал наилучшие результаты (>96%). Наибольшее уменьшение размерности было получено только при отслеживании поглощения на волнах определенной длины. В сочетании с линейным дискриминантным анализом, как и ожидалось, наблюдалось дополнительное снижение показателей. Теперь наиболее точные результаты (>88%) были получены при предварительной обработке с помощью стандартизации нормировкой вариации. Более того, была продемонстрирована значительно меньшая изменчивость по сравнению с использованием всего БИК-диапазона. Наконец, когда линейный дискриминантный анализ был обучен после уменьшения размерности и декорреляции при помощи метода главных компонент, были получены наилучшие результаты, наиболее точная классификация (>96%) была составлена с помощью метода первой производной, как при обработке стандартизации нормировкой вариации, так и без такой обработки. Однако эта модель продемонстрировала наибольшую нестабильность и изменчивость.

Подводя итог, можно сказать, что наибольшая эффективность была достигнута при проведении дискриминантного анализа на основе метода проекции на латентные структуры во всем БИК-диапазоне, при этом (1200 нм, 1470 нм) линейный дискриминантный анализ в двух измерениях при обработке данных с помощью стандартизации нормировкой вариации является целесообразной и экономически оправданной альтернативой. 

2. Флуоресцентная спектроскопия

Как и в случае спектроскопии отражения, были проведены многочисленные измерения образцов бочарных клепок. Помимо использования спектра излучения в диапазоне 374-464 нм, для уменьшения размерности и декорреляции данных можно использовать метод главных компонент. Количество основных компонентов определяется после перекрестной проверки. Для визуального осмотра образцов можно сохранить первые два основных компонента, показывая разделение только на кластеры неиспользованных бочек и бочек, использованных двукратно (рисунок 5). Классификация с помощью одних только пиков спектров возбуждения не продемонстрировала разделения на классы. Для определения точности классификации трех различных классов была снова проведена повторная пятикратная (вложенная) перекрестная проверка (таблица 2).

Поскольку явлению флуоресценции присуща высокая дисперсия, прослеживаемая по результатам необработанных спектров, ожидалось, что процесс классификации осложнится. Классификация с помощью линейного дискриминантного анализа, обученного на полных спектрах излучения, не продемонстрировала разделения трех образцов на классы с точностью < 40%. В данном случае необходима проекция на другую структуру с использованием дискриминантного анализа на основе метода проекции на латентные структуры или метода главных компонент. С другой стороны, при классификации с помощью дискриминантного анализа на основе метода проекции на латентные структуры или метода главных компонент были получены более точные характеристики. Однако по сравнению с результатами, полученными после измерений с помощью метода спектроскопии отражения, точность все же была значительно ниже.

Традиционные методы предварительной обработки не продемонстрировали существенного положительного влияния на полученные характеристики. Наилучшие результаты были получены при классификации с помощью линейного дискриминантного анализа после преобразования необработанных спектров (без предварительной обработки) с использованием метода главных компонент. Образцы бочек, использованных однократно, были классифицированы с точностью ±87%, в то время как образцы бочек, использованных двукратно, были классифицированы с точностью ±70%. Неправильно классифицированные образцы бочек, использованных однократно, были признаны как использованные двукратно, и наоборот. Модель относительно стабильна и продемонстрировала изменчивость около 0,7% в зависимости от разбиений данных для тренировки модели и тестирующих данных.

Рисунок 5

Рисунок 3. Диаграмма рассеяния первых 2 основных компонентов с использованием метода главных компонент. Величина отклонения указана в скобках рядом с осями. При использовании 2 первых компонентов разделение образцов бочек, использованных однократно и двукратно, на классы было невозможно, как можно было ожидать после обработки данных с помощью отбора переменных и дифференциального перекрывания исходных спектров флуоресценциb

3. Рамановская спектроскопия

В общей сложности было определено 30 контрольно-измерительных точек для каждого из трех различных классов, поскольку измерения комбинационного рассеяния света требуют больше времени, чем измерения коэффициента отражения или флуоресцентной спектроскопии. Для получения разных пиков сигналов комбинационного рассеяния потребовалось более длительное время исследования. Кроме того, сигнал комбинационного рассеяния света зависит от размера сфокусированного пятна над фокусной плоскостью.

Рисунок 6

Рисунок 4. (а) Средние сглаженные сигналы комбинационного рассеяния, к которым применен детрендинг, трех образцов древесины дуба. (b) Прямоугольная диаграмма комбинационного рассеяния света на длине волны 1594 нм, демонстрирующая типичный пик содержания танина. Существенная изменчивость возникает вследствие локальности измерения, в ходе которого образцы нельзя разделить на классы из-за неоднородного состав древесины

В данном случае, как и в предыдущих двух, было произведена стандартизация нормировкой вариации и высчитана первая и вторая производные функции для повышения эффективности классификации. Однако, как и ожидалось, качество результатов не повысилось. Кроме того, применение метода главных компонент не поспособствовало разделению образцов на классы.

Заключение

Три различных метода спектроскопических измерений были применены к образцам неиспользованной бочки и бочек, использованных однократно и двукратно, произведенных из древесины французского дуба. Содержание в древесине дуба химических соединений, таких как лигнин и танин, которые придают вину особый вкус, исследовалось с помощью упомянутых методов спектроскопии путем относительного количественного определения с помощью измерения образцов бочарных клепок.

Наибольшей эффективностью обладает спектроскопия отражения. Самую высокую точность продемонстрировал дискриминантный анализ на основе метода проекции на латентные структуры, при этом количество компонентов было тщательно подобрано с помощью поиска по сетке параметров и перекрестной проверки. Используя все БИК-спектры без какой-либо предварительной обработки данных, дискриминантный анализ на основе метода проекции на латентные структуры продемонстрировал правильную классификацию почти всех образцов (>99%). Метод вычисления первой производной функции в сочетании с методом главных компонент продемонстрировал высокую точность (>96%).

Флуоресцентная спектроскопия продемонстрировала значительно более низкую эффективность. Ввиду больших различий между сигналами естественной автофлуоресценции процесс классификации усложнился. Самую высокую эффективность (>70%) при обработке необработанных спектров продемонстрировал метод главных компонент в сочетании с линейным дискриминантным анализом.

Наконец, используемый метод рамановской спектроскопии не может рассматриваться для классификации различных образцов. В связи с большим количеством локальных измерений, состав самой древесины дуба во многом определил полученные сигналы. Ярко выраженной разницы показателей содержания танина, являющегося основным показателем частотности контакта бочки с вином, в разных образцах обнаружено не было.

 

© Avantes

Компания INSCIENCE помогает своим заказчикам решать любые вопросы и потребности по поставке лабораторного и научного оборудования производства Avantes на территории РФ

Online заявка

Теги avantes спектроскопия отражения флуоресцентная спектроскопия
Новые статьи
Повышение стабильности волоконного лазера, легированного эрбием, с насыщающимся поглотителем, полученным с помощью импульсного лазерного осаждения

В данной статье описаны эффективность и стабильность волоконного лазера, легированного эрбием, с насыщающимся поглотителем (НП) на основе ZnO (оксид цинка), полученным из раствора или с помощью импульсного лазерного осаждения

Двухступенчатое преобразование света с помощью квантовых точек внутри нелинейных кристаллов

В данной статье представлено исследование ап-конверсионного преобразования инфракрасного излучения в видимое на основе нетипичного двухступенчатого процесса, сочетающего генерацию второй гармоники с фотолюминесценцией с помощью композитного материала, образованного монокристаллами KH2PO4, в который во время роста вводят квантовые точки CdTe/CdS (КТ)

У Вас особенный запрос?
У Вас особенный запрос?
Весьма часто наши заказчики лучше нас знают, какое оборудование им нужно. В этом случае мы берём на себя общение с производителем, доставку и таможенную очистку, а также все вопросы гарантийного периода. Пожалуйста, заполните эту форму, и мы свяжемся с Вами, чтобы помочь решить любую Вашу задачу. Или позвоните нам по телефону +7(495)199-0-199
Форма заявки
Ваше имя: *
Ваше имя
Ваш e-mail: *
Ваш телефон: *
Ваш телефон
Наши
контакты
г. Москва, ул. Бутлерова, д. 17Б

г. Санкт-Петербург, улица Савушкина 83, корп. 3