На самом деле связь между популярным табличным процессором Microsoft Excel и генетикой не такая уж и неожиданная, как может показаться на первый взгляд.
Геном человека содержит 20—25 тыс.
активных генов: микроскопических цепочек ДНК и РНК, чья совокупность все определяет, делая каждого из нас уникальным.
Каждому гену присваивается уникальное имя и буквенно-цифровой индекс, известный как символ, который ученые используют в своих работах.
Однако за последний год генетикам пришлось переименовать 27 генов из-за того, что инструмент Microsoft неправильно интерпретирует эти символы в качестве даты.
За последний год или около того комитет по номенклатуре генов (HUGO Gene Nomenclature Committee — это подразделение Международной организации по изучению генома человека, присваивающее уникальные имена для всех известных человеческих генов) выпустил рекомендации по переименованию 27 генов.
И все из-за Microsoft Excel.
Дело в том, что редактор для работы с электронными таблицами, который пользуется большой популярностью и среди ученых, или, говоря точнее, функция автоформатирования ошибочно интерпретировала названия этих генов как даты.
Из-за этого в научных работах нередко возникали ошибки.
Например, название «MARCH1» (Membrane Associated Ring-CH-Type Finger 1) система автоматически исправляла на «1-Mar» (1 марта).
Ниже приведена «гифка», которая наглядно демонстрирует явление.
И случаются такие казусы довольно-таки часто.
Согласно одному исследованию 2016 года, система автокоррекции Excel наследила в каждой пятой из 3597 работ, опубликованных в рецензируемых научных журналах.
THRILLED by this announcement by the Human Gene Nomenclature Committee.
— Janna Hutz (@jannahutz) August 4, 2020.
Скажете автоматическое форматирование в Excel можно отключить или вручную задать корректный тип данных в отдельных столбцах? Можно, вот только проблему это полностью не решает: когда файл откроет другой человек на другом ПК, у которого функция автоформатирования по умолчанию включена, данные автоматически преобразятся.
И отказаться от Excel для генетиков тоже не вариант — они повсеместно используют этот инструмент в своей деятельности, в том числе при проведении клинических испытаний.
И поскольку внесения изменений со стороны Microsoft они не дождались, пришлось переименовать гены, которые система ошибочно распознавала как даты.
Так, например, тот же MARCH1 стал MARCHF1, а SEPT1 — SEPTIN1.
(Открывается в новом окне).