Элементы SBGN нотации в BioUML

Сущности

Сущности - это элементы графической нотации SBGN, описывающие компоненты биологической системы, участвующие в процессах (Рисунок 1). В BioUML доступны все типы сущностей нотации SBGN, которые разделяются на два класса:

  • материальные: макромолекула, простое химическое вещество, нуклеиновая кислота, неопределенная сущность, мультимер и комплекс;

  • концептуальные: пустое множество и возмущающий агент.

Сущности

Рисунок 1. Сущности SBGN нотации

Таблица 1. Описание сущностей SBGN нотации
Название Описание нотации SBGN
Неопределенная сущность Сущность, тип которой неизвестен либо не имеет прямого биологического значения.
Простое химическое вещество Определяется как противоположность макромолекулы: химическое соединение, которое не образуется путем ковалентного связывания псевдоидентичных остатков. Примерами этого типа могут служить атом, ион, радикал и другие биохимические вещества.
Макромолекулы Биохимические вещества, образующиеся от ковалентного связывания псевдоидентичных единиц - белки, нуклеиновые кислоты, полисахариды.
Нуклеиновая кислота Представляет собой фрагмент макромолекулы, несущий генетическую информацию. Обычно этот тип сущности используют для представления гена или транскрипта.
Мультимер Мультимер представляет собой совокупность множества одинаковых или псевдоидентичных соединений, удерживаемых вместе нековалентными связями. Примером мультимера может служить димерный рецептор. Существуют четыре типа мультимера: мультимер простого химического вещества, мультимер макромолекулы, мультимер с признаками нуклеиновой кислоты и мультимер комплекса.
Комплекс Комплекс представляет собой пул биохимических объектов, каждый из которых состоит из других биохимических объектов, будь то макромолекулы, простые химические вещества, мультимеры или другие комплексы.
Пустое множество Представляет собой отсутствие компонента в модели. Допустим, при создании реакции деградации, у которой отсутствует фактический продукт, на диаграмме будет отображаться пустое множество.
Возмущающий агент Отображает внешнее воздействие на компоненты модели. Например, это может быть изменение температуры, излучение, мутация и др.

Примечание

Некоторые типы сущностей могут опционально содержать вспомогательные единицы. При этом одной сущности может соответствовать несколько вспомогательных единиц.

Макромолекула (macromolecule), простое химическое вещество (simple chemical), нуклеиновая кислота (nucleic acid feature), неопределенная сущность (unspecified), возмущающий агент (perturbing agent) и комплекс (complex) добавляется на диаграмму засчет выбора иконки entity на панели инструментов и нажатия на место на диаграмме, где планируется разместить сущность. Выбор нужного типа сущности осуществляется в открывшемся окне в поле option sbgb:enityType (Рисунок 2).

Создание сущности в веб-версии BioUML

Рисунок 2. Создание сущности в веб-версии BioUML

Комплекс может быть создан также путем выбора иконки complex на панели инструментров. Для того, чтобы поместить в комплекс другие объекты, необходимо зажать их левой кнопкой мыши и поместить внутрь него.

Мультимер создается засчет указания в поле option sbgn:multimer количества субъединиц, входяших в его состав. Мультимер можеть быть создан для всех типов упомянутых выше сущностей, за исключением возмущающего агента и неопределенной сущности. Cозданный мультимер будет содержать единицу информации вида N:n, где n - количество субъединиц в составе мультимера.

Компартмент

Компартмент является отдельным элементом диаграммы, в составе которого могут находиться сущности (Рисунок 3). Компартмент создается с помощью нажаться на иконку compartment, расположенную на панели инструментов.

Компартмент

Рисунок 3. Компартмент

Примечание

Отдельная сущность может принадлежать только одному компартменту. Таким образом, «одни и те же» биохимические компоненты, находящиеся в двух разных компартментах, на самом деле представляют собой две разных сущности. После того, как сущность будет перемещена в компартмент, название этой переменной будет изменено путем добавления названия компартмента перед названием сущности. Например, $compartment.entity.

SBGN диаграмма сигналинга IGF-1

Рисунок 4. SBGN диаграмма сигналинга IGF-1 , содержащая два компартмента - внеклеточное пространство (extracellular) и цитозоль (cytosol)

Добавленные компартменты отображаются в поля операций во вкладке Model на горизонтальной панели и в открывшемся окне на вертикальной панели во вкладке Compartments (Рисунок 5). Для добавленного компартмента можно изменить его заголовок в поле Title, указать численное значение в столбце Initial value. Флаг константы ставится в столбце Constant и определяет является ли численное значение переменной константы постоянной и может ли быть изменено. В столбце Units из выпадающего списка выбирается единица измерения.

Вкладка Compartments в поле операций

Рисунок 5. Вкладка Compartments в поле операций

Вспомогательные единицы

В BioUML доступны все типы вспомогательных единиц, описанной в нотации SBGN: единицы информации, переменные состояния и маркеры клонирования (Рисунок 6). Каждой сущности может соответсвовать несколько вспомогательных единиц как одного типа, так и нескольких.

Вспомогательные единицы

Рисунок 6. Вспомогательные единицы

Единица информации используется для добавления дополнительной информации к сущности. Для определенных типов информации, нотация SBGN определяет конкретные префиксы. С более подробной информацией о префиксах можно ознакомиться по ссылке (https://sbgn.github.io/).

  • pt - физические характеристики, такие как температура (pc:T), pH (pc:pH) и др. Предполагается, что они будут использоваться для описания характера возмущающего воздействия агента или фенотипа.

  • mt - биологический тип сущности, такие как ДНК (mt:dna), РНК (mt:rna), ион (mt:ion) и др.

  • ct - концептуальные типы сущности, такие как ген (ct:gene), сайт транскрипции (ct:tss) и др.

Регуляция экспрессии гена

Рисунок 7. Пример использования единиц информации при создании диаграммы, описывающей процесс регуляции экспрессии гена

Для того, чтобы добавить вспомогательную единицу к сущности, нажмите на иконку unit_of_information, расположенную на панели инструментов и затем на выбранную сущность.

Переменные состояния используются для описания изменения физического состояния биологического объекта. Обычно, переменная состояния строится из двух подстрок, разделенных символом «@», первая из которых идентифицирует значение переменной состояния, а вторая — ее имя. Например, при описании процесса фосфорилирования белка, для нефосфорилированной формы может использоваться переменная состояния «@S122» либо пустое состояние, обозначающая позицию фосфорилирования, и для фосфорилированной формы - «P@S122», где P - остаток фосфорной кислоты. Символ «@» опускается, если переменная состояния не имеет имени, как например, при обозначении активной и неактивной формы белка.

Для некоторых переменных состояния, отображающих ковалентные модификации макромолекул, существуют определенные идентификаторы. Например, фосфорилирование (P), ацетилирование (Ac), метиилирование (Me) и др.

Для того, чтобы добавить переменную состоянию к сущности, нажмите на иконку variable, расположенную на панели инструментов и затем на выбранную сущность.

Регуляция экспрессии гена

Рисунок 8. Пример использования переменных состояния при создании диаграммы, описывающей процесс фосфорилирования белка

Маркеры клонирования используются при дублировании сущности на диаграмме.

Для создания клона нажмите на сущность, которую хотите клонировать и затем на иконку clone_node, расположенную на общей панели управления. Чтобы объединить клоны, нажмите на клон и затем на иконку merge_node.

Гликолиз

Рисунок 9. Пример использования маркеров клонирования при создании диаграммы, описывающей процесс гликолиза. АТФ и АДФ встречаются в этом пути 4 раза, поэтому оба идентифицируются с помощью клон-маркера.

Заметка

Заметка используется для добавления дополнительной информации, например, детального описания молекулярных механизмов, отображенных на диаграмме (Рисунок 10). Аннотация может быть представлена как отдельный элемент на диаграмме, так и быть связанной с сущностью при помоши ребра заметки.

Заметка

Рисунок 10. Заметка

Для того, чтобы создать заметку, нажмите на иконку note, расположенную на панели инструментов. Затем, вы можете связать ее с сущностью, создав ребро заметки, нажав на иконку note_link, и соединив этим ребром сущность и аннотацию.

Заметка

Рисунок 11. Пример использования заметки, связанной с сущностью.

Процессы

Процессы преобразуют один или несколько пулов сущностей в один или несколько пулов сущностей, идентичных или разных. На диаграмме процессы отображаются в виде круга или квадрата, которые соединены с небольшими дугами (ребрами), прикрепленными к центрам противоположных сторон фигуры процесса (Рисунок 12).

Примечание

Создание реакций с использованием описанных элементов диаграммы будет обсуждаться в разделе «Визуальное моделирование процесса».

Согласно нотации SBGN существует один общий тип - базовый процесс (process), а также пять типов специфических процессов: пропущенный процесс (omitted process), неопределенный процесс (uncertain process), ассоциация (association), диссоциация (dissociation) и фенотип (phenotype).

Процессы

Рисунок 12. Процессы

Таблица 2. Описание процессов
Тип процесса Описание
Базовый процесс Общий процесс, описывающий преобразование набора биохимических объектов в другой набор сущностей. Примеры: ковалентные модификации белков, транслокация.
Пропущенный процесс Процесс, который опускается при создании диаграммы, может соответствовать нескольким фактическим процессам.
Ассоциация Нековалентное связывание биологических объектов и образование комплекса. Примеры: образование мультимера, комплекса.
Диссоциация Разрыв нековалентного связывания между биологическими объектами. Примеры: распад комплекса, мультимера.
Фенотип Процесс, приводящий к проявлению фенотипа. Пример: связь белка c-Fos с фенотипом через процесс транскрипции генов.

Ребра

По нотации SBGN выделяется четыре типа ребер - ребра потоков, ребра модуляции, логическое ребро и ребро аннотации.

Ребра потоков позволяют представить, какие пулы сущностей потребляются и производятся процессом. Ребра потребления связывают процессы с реагентами, а ребра производства связывают процессы с продуктами (Рисунок 13). При создании реакции в BioUML эти ребра создаются автоматически.

Транслокация

Рисунок 13 Диаграмма, описывающая транспорт иона Ca2+. В реакции траслокации тип использованного процесса - базовый процесс, с ребрами потребления и продукции.

Ребра модуляции представляют собой влияние пулов сущностей на процессы. Выделяется пять видов ребер: модуляция, стимуляция, катализ, ингибирование и необходимая стимуляция (Рисунок 14).

Ребра

Рисунок 14. Ребра

Модуляция используется, когда неизвестно точное направление процесса - положительное или отрицательное воздействие, которое может зависеть, например, от концентрации реактантов. Примером модуляции может служить влияние никотина на конформацию никотинового рецептора ацетилхолина (Рисунок 15). Высокие концентрации никотина открывают рецептор, тогда как низкие концентрации могут снизить его чувствительность, не открывая его.

Модуляция

Рисунок 15. Диаграмма модуляции открытия никотиновых рецепторов никотином

Стимуляция положительно влияет на поток процесса, представленного целевым процессом. Эта стимуляция может представлять собой, например, катализ или положительную аллостерическую регуляцию. Однако, катализ существует независимо в SBGN нотации.

Стимуляция

Рисунок 16. Диаграмма противоположного влияния агонистов и обратных агонистов на рецептор GPCR. При создании реакций были использованы ребра стимуляции

Катализ — это частный случай стимуляции, при котором эффектор положительно влияет на поток процесса, представленного целевым процессом. Положительное влияние на процесс обусловлено снижением энергии активации реакции.

Катализ

Рисунок 17. Диаграмма, отображающая процесс катализации фосфорилирования МАРК киназой MAPKK

Ингибирование отрицательно влияет на поток процесса, представленного целевым процессом. Ингибирование может быть, например, конкурентным ингибированием или аллостерическим ингибированием.

Ингибирование

Рисунок 18. Диаграмма, отображающая процесс ингибирования превращения АТФ в цАМФ с помощью белка Gαi

Необходимая стимуляция – это стимуляция, необходимая для того, чтобы процесс состоялся.

Трансляция

Рисунок 19. Диаграмма, отображающая транскрипцию гена и последующую трансляцию

Логические операторы

Логические операторы обозначают механизм совместного действия пула или нескольких пулов сущностей. Выделяются три типа логических операторов: «И», «ИЛИ», «НЕ» (Рисунок 20).

Логические операторы

Рисунок 20. Логические операторы

Примечание

Добавление логических операторов в реакцию обсуждается в разделе Визуальное моделирование реакций

Логическое ребро создается автоматические при использовании логического оператора и соединяет пул сущностей и логический оператор.

Логический оператор «И» используется для обозначения того, что все узлы, связанные как входные, необходимы для получения выходных данных. Примером использования этого логического оператора заключается в синтезе мРНК IRF1, для которого необходимы как ген IRF1, так и комплекс, образованный белком STAT1 и регуляторной областью гена IRF1-GAS. Таким образом, логический оператор «И» связывает оба компонента, стимулируя процесс, который приводит к синтезу мРНК IRF1 (Рисунок 21).

И

Рисунок 21. Пример использования логического оператора «И»

Логический оператор «ИЛИ» используется для обозначения того, что любой узел, связанный как входной, достаточен для получения выходных данных. В следующем примере показана транскрипция мРНК SDH2-3, активируемая пулом комплексов транскрипционных факторов, каждый из которых способен в одиночку активировать транскрипцию (Рисунок 22).

ИЛИ

Рисунок 22. Пример использования логического оператора «ИЛИ»

Логический оператор «НЕ» используется для обозначения того, что выходные данные получаются только при отсутствии определенных входных данных. Следующий пример показывает, что продукция комплекса циклин-CDK не стимулируется белком p21 (Рисунок 23).

НЕ

Рисунок 23. Пример использования логического оператора «НЕ»