Excel обвинили в опечатках в 20% статей по генетике

Фото: Tess Watson / Flickr

Ученые проанализировали тысячи статей по генетике, опубликованные за последние 10 лет, и пришли к выводу, что почти в каждой пятой публикации встречаются опечатки в названиях генов, связанные с настройками по умолчанию в Excel. Программа автоматически изменяла названия генов на даты или числа с плавающей точкой.

Каждому хотя бы раз приходилось бороться с автозаменой, настойчиво предлагающей более распространенное слово. У генетиков похожие проблемы: названия генов, похожие на даты (например, SEPT2 или MARCH1) или на числа с плавающей точкой (например, 2310009E13), редактор таблиц Microsoft Excel с настройками по умолчанию автоматически переводит в другой формат.

Чтобы оценить распространенность опечаток, ученые проанализировали 35 175 электронных таблиц Excel из 3597 научных публикаций, вышедших в 19 научных журналах с 2005 по 2015 год. В 704 из них нашлись опечатки в названиях генов, связанные с автоформатированием.

Поскольку полностью отключить эту опцию нельзя ни в Excel, ни в бесплатных аналогах LibreOffice Calc и Apache OpenOffice Calc, авторы статьи рекомендуют ученым задавать формат данных вручную.

Исследование группы австралийских ученых опубликовано в журнале Genome Biology.

Недавно американские лингвисты также обнаружили, как стиль научной статьи может указывать на подтасовку данных. В работах с фальсифицированными данными оказалось больше научного жаргона и неоправданно сложных предложений.

Теги:

Читать еще на Чердаке: