Генетический алгоритм (Genetic Algorithm) это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путём случайного подбора, комбинирования и вариации искомых параметров с использованием механизмов, аналогичных естественному отбору в природе. Генетический алгоритм требует генетического представления решения и функции пригодности для оценки решения209.
Генетический оператор (Genetic operator) это оператор, используемый в генетических алгоритмах для направления алгоритма к решению данной проблемы. Существует три основных типа операторов (мутация, скрещивание и отбор), которые должны работать в сочетании друг с другом, чтобы алгоритм был успешным210.
Геномные данные (Genomic data) этот термин относится к данным генома и ДНК организма. Они используются в биоинформатике для сбора, хранения и обработки геномов живых существ. Геномные данные обычно требуют большого объема памяти и специального программного обеспечения для анализа211.
Гетероассоциативная память (Hetero Associative memory) это память, похожа на сеть автоассоциативной памяти, это также однослойная нейронная сеть. Однако в этой сети входной обучающий вектор и выходные целевые векторы не совпадают. Веса определяются таким образом, чтобы сеть хранила набор шаблонов. Гетероассоциативная сеть носит статический характер, следовательно, в ней не будет нелинейных операций и операций с запаздыванием. Архитектура, как показано на следующем рисунке, архитектура сети гетероассоциативной памяти имеет «n» количество входных обучающих векторов и «m» количество выходных целевых векторов212.
Гибридизация человека и машины (Human-machine hybridization) это технология, позволяющая соединить человеческое тело и технологическую систему. Текущий подход к разработке интеллектуальных систем (например, на основе технологий искусственного интеллекта) в основном ориентирован на данные. Он имеет ряд ограничений: принципиально невозможно собрать данные для моделирования сложных объектов и процессов; обучение нейронных сетей требует огромных вычислительных и энергетических ресурсов; и решения не объяснимы. Современные системы ИИ (основанные на узком ИИ) вряд ли можно считать интеллектом. Это скорее следующий уровень автоматизации человеческого труда. Перспективной концепцией, лишенной вышеуказанных ограничений, является концепция гибридного интеллекта, объединяющая сильные стороны узкого ИИ и возможности человека. Гибридные интеллектуальные системы обладают следующими ключевыми особенностями: Когнитивная интероперабельность позволяет искусственным и естественным интеллектуальным агентам легко общаться для совместного решения проблемы; Взаимная эволюция (коэволюция) позволяет гибридной системе развиваться, накапливать знания и формировать общую онтологию предметной области. Ядром гибридизации человеко-машинного интеллекта является функциональная совместимость биологических и технических систем на разных уровнях от физических сигналов до когнитивных моделей213.
Гибридные модели (Hybrid models) это комбинации моделей на основе данных с «классическими» моделями, а также комплексирование различных методов искусственного интеллекта214.
Гибридный суперкомпьютер (Hybrid supercomputer) это вычислительная система, объединяющая ЦП традиционной архитектуры (например, x86) и ускорители, например, на вычислительных графических процессорах215.
Гиперпараметр (настройка гиперпараметра) (Hyperparameter) в машинном обучении это параметры алгоритмов, значения которых устанавливаются перед запуском процесса обучения. Гиперпараметры используются для управления процессом обучения216.
Гипер-эвристика (Hyper-heuristic) это эвристический метод решения задачи, который стремится автоматизировать, часто путем включения методов машинного обучения, процесс выбора, объединения, генерации или адаптации нескольких более простых эвристик (или компонентов таких эвристик) для эффективного решения задач вычислительного поиска. Одной из мотиваций для изучения гипер-эвристики является создание систем, которые могут обрабатывать классы проблем, а не решать только одну проблему217.
Глубина (Depth) это количество слоев (включая любые встраивающие слои) в нейронной сети, которые изучают веса. Например, нейронная сеть с 5 скрытыми слоями и 1 выходным слоем имеет глубину 6218.
Глубокая модель (Deep model) это тип нейронной сети, содержащий несколько скрытых слоев219.
Глубокая нейронная сеть (ГНС) (Deep neural network) многослойная сеть, содержащая между входным и выходным слоями несколько (много) скрытых слоёв нейронов, что позволяет моделировать сложные нелинейные отношения. ГНС сейчас всё чаще используются для решения таких задач искусственного интеллекта, как распознавание речи, обработка текстов на естественном языке, компьютерное зрение и т.п., в том числе в робототехнике220.
Глубоко разделяемая сверточная нейронная сеть (Depthwise separable convolutional neural network) это архитектура сверточной нейронной сети, основанная на Inception (раздел с данными на GitHub), но в которой модули Inception заменены свертками, отделяемыми по глубине. Также известен как Xception221.
Глубокое обучение (Deep Learning) это разновидность машинного обучения на основе искусственных нейронных сетей, а также глубокое (глубинное) структурированное или иерархическое машинное обучение, набор алгоритмов и методов машинного обучения (machine learning) на основе различных видов представления данных. Обучение может быть контролируемым, полу контролируемым (semi-supervised) или неконтролируемым. Использование в глубоком обучении рекуррентных нейронных сетей (recurrent neural networks), позволяет эффективно решать задачи в областях компьютерного зрения, распознавания речи, обработки текстов на естественном языке, машинного перевода, биоинформатики и др.222.
Государство-как-Платформа (State-as-Platform) это концепция трансформации государственного управления с использованием возможностей, которые нам дают новые технологии. Целевой функцией реализации идеи «Государство-как-Платформа» является благополучие граждан и содействие экономическому росту, основанному на внедрении технологий. В фокусе развертывания Платформы находится гражданин в условиях новой цифровой реальности. Государство должно создать условия, которые помогут человеку раскрыть свои способности, и сформировать комфортную и безопасную среду для его жизни и реализации потенциала, а также для создания и внедрения инновационных технологий223,224.
Градиент (Gradient) это вектор, своим направлением указывающий направление наибольшего возрастания некоторой скалярной величины (значение которой меняется от одной точки пространства к другой, образуя скалярное поле), а по величине (модулю) равный скорости роста этой величины в этом направлении225.
Градиентная обрезка (Gradient clipping) это метод, позволяющий справиться с проблемой взрывающихся градиентов путем искусственного ограничения (отсечения) максимального значения градиентов при использовании градиентного спуска для обучения модели226.
Градиентный спуск (Gradient descent) это метод минимизации потерь путем вычисления градиентов потерь по отношению к параметрам модели на основе обучающих данных. Градиентный спуск итеративно корректирует параметры, постепенно находя наилучшую комбинацию весов и смещения для минимизации потерь227.
Граница решения (Decision boundary) это разделитель между классами, изученными моделью в задачах классификации двоичного класса или нескольких классов228.
Граница решения или поверхность решения (в статистико-классификационной задаче с двумя классами) (Decision boundary) это гиперповерхность, разделяющая нижележащее векторное пространство на два множества, по одному для каждого класса. Классификатор классифицирует все точки на одной стороне границы принятия решения как принадлежащие одному классу, а все точки на другой стороне как принадлежащие другому классу.
Граф (Graph) это таблица, составленная из данных (тензоров) и математических операций. TensorFlow это библиотека для численных расчетов, в которой данные проходят через граф. Данные в TensorFlow представлены n-мерными массивами тензорами229.
Граф (абстрактный тип данных) (Graph) в информатике граф это абстрактный тип данных, который предназначен для реализации концепций неориентированного графа и ориентированного графа из математики; в частности, область теории графов230.
Граф (с точки зрения компьютерных наук и дискретной математики) (Graph) это абстрактный способ представления типов отношений, например дорог, соединяющих города, и других видов сетей. Графы состоят из рёбер и вершин. Вершина это точка на графе, а ребро это то, что соединяет две точки на графе231.
Графический кластер (Graphics Processing Cluster, GPC) это доминирующий высокоуровневый блок, включающий все ключевые графические составляющие232.
Графический процессор (Graphical Processing Unit) это отдельный процессор, расположенный на видеокарте, который выполняет обработку 2D или 3D графики. Имея процессор на видеокарте, компьютерный процессор освобождается от лишней работы и может выполнять все другие важные задачи быстрее. Особенностью графического процессора (GPU), является то, что он максимально нацелен на увеличение скорости расчета именно графической информации (текстур и объектов). Благодаря своей архитектуре такие процессоры намного эффективнее обрабатывают графическую информацию, нежели типичный центральный процессор компьютера233.
Графический процессор-вычислитель (Computational Graphics Processing Unit) (ГП-вычислитель cGPU) это многоядерный ГП, используемый в гибридных суперкомпьютерах для выполнения параллельных математических вычислений; например, один из первых образцов ГП этой категории содержит более 3 млрд транзисторов 512 ядер CUDA и память ёмкостью до 6 Гбайт234.
Графовая база данных (Graph database) это база, предназначенная для хранения взаимосвязей и навигации в них. Взаимосвязи в графовых базах данных являются объектами высшего порядка, в которых заключается основная ценность этих баз данных. В графовых базах данных используются узлы для хранения сущностей данных и ребра для хранения взаимосвязей между сущностями. Ребро всегда имеет начальный узел, конечный узел, тип и направление. Ребра могут описывать взаимосвязи типа «родитель-потомок», действия, права владения и т. п. Ограничения на количество и тип взаимосвязей, которые может иметь узел, отсутствуют. Графовые базы данных имеют ряд преимуществ в таких примерах использования, как социальные сети, сервисы рекомендаций и системы выявления мошенничества, когда требуется создавать взаимосвязи между данными и быстро их запрашивать235.
Графовые нейронные сети (Graph neural networks) это класс методов глубокого обучения, предназначенных для выполнения выводов на основе данных, описанных графами. Графовые нейронные сети это нейронные сети, которые можно напрямую применять к графам и которые обеспечивают простой способ выполнения задач прогнозирования на уровне узлов, ребер и графов. GNN могут делать то, что не смогли сделать сверточные нейронные сети (CNN). Также под Графовыми нейронными сетями понимают нейронные модели, которые фиксируют зависимость графов посредством передачи сообщений между узлами графов. В последние годы варианты GNN, такие как сверточная сеть графа (GCN), сеть внимания графа (GAT), рекуррентная сеть графа (GRN), продемонстрировали новаторские характеристики во многих задачах глубокого обучения236.
Графы знаний (Knowledge graphs) это структуры данных, представляющие знания о реальном мире, включая сущности люди, компании, цифровые активы и т.д.) и их отношения, которые придерживаются модели данных графа сети узлов (вершин) и соединения (ребер/дуг)237.
Гребенчатая регуляризация (Ridge regularization) синоним «Регуляризации L
2
2
«Д»
Данные (Data) это информация собранная и трансформированная для определенных целей, обычно анализа. Это может быть любой символ, текст, цифры, картинки, звук или видео.
Данные тестирования (Testing Data) это подмножество доступных данных, выбранных специалистом по данным для этапа тестирования разработки модели.
Данные ограниченного использования (Restricted-use data) это данные, которые содержат конфиденциальную информацию (обычно о людях), которая может позволить идентифицировать людей. Наличие конфиденциальной информации в депонированном цифровом контенте представляет собой проблему управления для долгосрочного хранения, чтобы гарантировать, что требования к архивному хранилищу для достижения распределенной избыточности учитывают, например, требования конфиденциальности239.
Дартмутский семинар (Dartmouth workshop) Дартмутский летний исследовательский проект по искусственному интеллекту так назывался летний семинар 1956 года, который многие считают основополагающим событием в области искусственного интеллекта240.
Датамайнинг (Datamining) это процесс обнаружения и интерпретации значимых закономерностей и структур в исходных данных, которые могут быть использованы для решения сложных бизнес-вопросов и высокоинтеллектуального прогнозирования241.
Даунсэмплинг (downsampling) это уменьшение количества информации в функции для более эффективного обучения модели. Например, перед обучением модели распознавания изображений, субдискретизация изображений с высоким разрешением до формата с более низким разрешением; Обучение на непропорционально низком проценте чрезмерно представленных примеров классов, чтобы улучшить модель обучения на недопредставленных классах242.
Движок искусственного интеллекта (Artificial intelligence engine) (также AI engine, AIE) это движок искусственного интеллекта, аппаратно-программное решение для повышения скорости и эффективности работы средств системы искусственного интеллекта.
Двоичное число (Binary number) это число, записанное в двоичной системе счисления, в которой используются только нули и единицы. Пример: Десятичное число 7 в двоичной системе счисления: 111243.
Двоичный формат (Binary format) это любой формат файла, в котором информация закодирована в каком-либо формате, отличном от стандартной схемы кодирования символов. Файл, записанный в двоичном формате, содержит информацию, которая не отображается в виде символов. Программное обеспечение, способное понимать конкретный метод кодирования информации в двоичном формате, должно использоваться для интерпретации информации в файле в двоичном формате. Двоичные форматы часто используются для хранения большего количества информации в меньшем объеме, чем это возможно в файле символьного формата. Их также можно быстрее искать и анализировать с помощью соответствующего программного обеспечения. Файл, записанный в двоичном формате, может хранить число «7» как двоичное число (а не как символ) всего в 3 битах (т.е. 111), но чаще используется 4 бита (т.е. 0111). Однако двоичные форматы обычно не переносимы. Файлы программного обеспечения записываются в двоичном формате. Примеры файлов с числовыми данными, распространяемых в двоичном формате, включают двоичные версии IBM файлов Центра исследований цен на ценные бумаги и Национального банка торговых данных Министерства торговли США на компакт-диске. Международный валютный фонд распространяет международную финансовую статистику в смешанном формате и двоичном (упакованно-десятичном) формате. SAS и SPSS хранят свои системные файлы в двоичном формате244.