Перспективный план развития строительной индустрии до 2030 года предусматривает поэтапный перевод нормативно-технической базы в цифровой формат. При этом, Минстрой предполагает уже через 3-5 лет полностью перевести нормативную базу в цифровую форму, что требует ее структуризации до нужного уровня. Безусловно, это давно назревший и естественный шаг. Цифровая трансформация сама по себе не панацея; она может решить проблемы. Например, зачем называть проектную документацию информационной моделью? Кому и зачем нужен КСИ? И наконец, правильный ли это выбор — директивное навязывание “прогресса”? Следует отметить, что министр финансов Великобритании в 2023 году (после 12 лет цифровых экспериментов в строительной отрасли) задается вопросом: почему в этой стране инфраструктурный проект обходится в 10 раз дороже, чем во Франции. Во всем этом предлагаем разобраться в данной статье.
Знания и данные
Простой здравый смысл подсказывает: все, что есть в нормах, — правила, требования, рекомендации — все это знания. Нормативная база — есть база знаний.
Может быть, Минстрой собирается сделать машинопонимаемыми знания? Вряд ли. Я даже не уверен, есть ли у цифровых реформаторов понимание того, что такое знания.
За терминологию «цифровизации» теперь отвечает ГОСТ 10.00.00.01. Определения знаний там нет, но есть ссылка на ГОСТ 33707-2016, в котором можно прочитать следующее.
4.398 знания: Совокупность фактов, событий, убеждений, а также правил, организованных для систематического применения.
4.78 база знаний: База данных, которая содержит правила логических выводов и информацию о человеческом опыте и знаниях экспертов в предметной области.
Трудно придумать что-то менее вразумительное. Исходя из первого определения, знания — это совокупность событий. Исходя из второго, знания — это данные, содержащие информацию о знаниях.
Сегодня компьютерная обработка знаний — передний край информационных технологий, следующий шаг после датацентричных приложений. Вычислимые знания пытаются использовать в медицине, финансах, юриспруденции, сфере обслуживания. А что же в строительстве?
То же, что и десять лет назад: информация, информационная модель, данные, большие данные, среда общих данных. Десять лет топтания на месте, разговоров либо не о том (о данных), либо ни о чем (об информации). В проекте постановления правительства о «Правилах формирования и ведения информационной модели» о знаниях нет ни слова. По-видимому, наполнять модель собираются чем-то другим.
Ниже — определения знаний с точки зрения автора статьи.
Знания: Концептуализированное описание человеческого опыта на естественном языке.
База знаний: Концептуализированное описание предметной области на естественном языке.
Ключевые слова здесь «концептуализация» и «естественный язык». Знание непредставимо без концептуализации, а естественный язык — это язык концепций.
Чтобы расставить точки над «и», внесем ясность и по поводу информации и данных.
Единого определения информации в ГОСТ 10.00.00.01 также нет. Есть несколько ссылок на источники, в которых информацией называют сведения, данные, структурированные данные, сведения в любой форме. Можно сделать вывод, что точных границ у термина «информация» не существует. Тогда так и запишем.
Информация: любые сведения в любой форме о любых объектах (предметах, процессах, явлениях).
Данные в ГОСТ 10.00.00.01 определяются следующим образом.
Данные (data): Информация, представленная в формализованном виде, пригодном для передачи, интерпретации или обработки с участием человека или автоматическими средствами.
С точки зрения автора статьи, определение должно быть таким.
Данные: сведения о конкретных (в отличие от концептуальных) объектах (предметах, процессах, явлениях).
Два подхода к цифровизации
ГОСТ 10.00.00.01 определяет два подхода к построению информационных систем: документоориентированный и моделеориентированный. Само название системы новых стандартов говорит о том, какой подход решили сделать государственным.
Напомню, что глобальная цифровая революция в строительной отрасли началась в Великобритании в 2011 году. Она провозглашала технологический и культурный сдвиг, выход за рамки бумажного «плоского» проектирования. На самом деле это была попытка отказаться от проектирования на основе знаний в пользу датацентричного проектирования.
Чтобы понять разницу в подходах, нужно просто сравнить два понятия: знания и данные. Вот, например, что говорится по этому поводу в медицинских источниках.
Отличие знаний от данных
Данные о пациентах | Клинические знания | |
---|---|---|
К кому применимы | К конкретному пациенту | К любому пациенту |
Источник | Конкретный пациент | Исследование многих пациентов |
Представление | Числа, коды, текст, изображения, звуки… | Устное слово, письменный текст, машинопонимаемый текст |
Конфиденциальность | Высокая | Низкая |
Последствия ошибок | Последствия для конкретного пациента | Масштабные последствия в результате недостоверных знаний или неправильной интерпретации знаний |
Естественно, «культурный сдвиг» закончился провалом. В 2018 году был отменен правительственный мандат на BIM Level 2, а в 2022 произошел спуск флага: информационное моделирование зданий превратилось в информационное управление.
В России с небольшим отставанием реформа пришла к тому же результату. Кроме того, что документацию стали называть информационной моделью, а 3D модель — графической частью документации, других прорывов в отрасли не произошло.
Реальное проектирование — проектирование на основе знаний
Использование знаний в строительной практике можно пояснить на простом примере. Фраза «Перегородки армировать сетками через 5 рядов кладки» часто встречается в проектах. Это концептуальное описание армирования перегородок, понятное любому инженеру или каменщику. Перегородки, сетки, ряды кладки — все это концепции. Чтобы с помощью моделирования воспроизвести содержание фразы, нужно на всех этажах многоэтажного здания перестроить перегородки, добавив к ним растворные швы и разложив арматурные сетки в каждом пятом шве.
Реальное строительное проектирование — практически полностью документо ориентированный процесс. Техническую документацию в целом можно представить в виде многоуровневой пирамиды знаний. На верхнем уровне лежат общие требования безопасности и эффективности; ниже — отраслевые требования и рекомендации; еще ниже — типовые технические решения. Каждый нижележащий уровень является конкретизацией вышележащего. Это значит, количество документов увеличивается, а область применения знаний, содержащихся в отдельном документе, сокращается.
Рабочие проекты располагаются внизу пирамиды и являются последней ступенью конкретизации перед осуществлением. Все, что в нормах присутствует в виде допустимых диапазонов, границ, вариантов, — в рабочем проекте превращается в конкретное проектное решение.
Можно отметить следующие закономерности пирамиды знаний.
- Чем ниже уровень пирамиды, тем ниже надежность и достоверность знаний этого уровня. На уровне рабочих проектов надежность падает скачкообразно, что вполне объяснимо.
- С ростом конкретизации знаний растет количество знаний, представленных в виде графических изображений. Однако принципиальных отличий между документами разного уровня не существует. Все виды документов, начиная от правительственных постановлений и заканчивая деталировочными чертежами рабочих проектов, подпадают под одно общее определение — иллюстрированный (алфавитно-пиктографический) текст.
Неизбежно возникает вопрос о роли моделирования в документоориентированной среде. Короткий ответ: моделирование является инструментом для получения недостающих знаний. Предыдущий опыт не может охватить все случаи проектирования. Недостаток знаний восполняется путем построения цифровых аналогов и их испытанием. Полученные в ходе испытаний знания добавляются в общую базу знаний проекта.
Можно сказать, что общая база знаний проекта содержит конкретизированные в соответствии с местными условиями и требованиями заказчика:
- нормативные знания, т.е. знания, полученные на основе опыта проектирования, строительства и эксплуатации реальных объектов в масштабах государства;
- корпоративные знания (то же, но в масштабах организации);
- индивидуальные знания, т.е. знания, основанные на личном опыте участников проекта;
- дополнительные знания, полученные в результате цифрового моделирования.
Все знания должны быть документированы, т.е. стандартным образом оформлены и заверены.
В правительственном постановлении информационной моделью называется традиционная проектная документация, дополненная при необходимости цифровой информационной моделью. С таким дополнением «единый источник истины» на самом деле является гибридом, состоящим из двух разнородных несовместимых источников: документированных знаний и необработанных данных. Придумать ответ на вопрос, что за необходимость прикладывать к базе готовых знаний инструменты (модели), с помощью которых какая-то часть этих знаний была получена, — предлагается заказчику.
Проверка документов и моделей
Одним из основных преимуществ машинопонимаемых документов является возможность автоматической проверки на соответствие этим документам. Объектами проверки могут быть документы более низкого уровня, цифровые модели и реальные строительные объекты.
Проверка проектной документации
Проектная документация является законом, источником и критерием истины для реального строительства. В то же время, как уже говорилось, вероятность ошибок в документах, разрабатываемых на стадии рабочего проектирования, наиболее высока. Автоматизированная проверка проектной документации на соответствие нормативным требованиям позволит сократить время проектирования и повысить надежность принятых решений.
Проверка документации может быть частью экспертной системы наряду с другими частями, такими как поиск релевантных знаний и поддержка технических решений.
Проверка цифровых информационных моделей
Международная организация buildingSMART разрабатывает методы проверки федеральных моделей на соответствие строительным правилам. Федеральная модель — это IFC модель, скомпонованная из нескольких внутридисциплинарных моделей.
Как отмечалось выше, реальные объекты проверяются не на соответствие нормам, а на соответствие проектной документации. Такого же подхода можно было ожидать и в случае проверки цифровых двойников реальных объектов.
buildingSMART почему-то не рассматривает проектную документацию в качестве источника истины, хотя, по сравнению с нормами, в ней содержится гораздо больше знаний, относящихся к конкретному объекту проектирования. Игнорирование этих знаний ведет к тому, что значительная часть информации в модели будет документально необоснованной.
Минстрой в этом вопросе более последователен. В ГОСТ 10.00.00.01 дается следующее определение дефекта информационной модели.
41 дефект: Каждое единичное отступление от принятых на проекте решений, неисполнение требований заказчика и норм или ошибка.
Минстрой и buildingSMART осознают необходимость проверки моделей на соответствие документированным источникам. Остался один шаг до осознания, что эта необходимость полностью дискредитирует идею моделеориентированного подхода.
Кодирование вместо вычисления знаний
Вычисление знаний — это автоматический перевод с естественного языка на низкоуровневый машинный язык. Кодирование — ручной или полуручной аналог автоматического перевода.
Кодирование вместо вычисления знаний — прямой путь в цифровое болото. История с КСИ подсказывает, что цифровизация в России сворачивает как раз в эту сторону.
Согласно Градостроительному кодексу, использование классификатора строительной информации является обязательным условием формирования информационной модели. Ниже приведена одна из таблиц классификатора.
Рис. 1. Классификационная таблица
Красным выделена информация, представленная на человеческом языке. По сути, она является конкретизацией (контекстом) описания элементов традиционного проекта. Остальная часть таблицы — это попытка зашифровать контекст с целью использования в информационных моделях.
Цитаты на сайте Минстроя:
- «Классификатор строительной информации представляет собой единый язык общения участников строительного процесса … КСИ обеспечит возможность однозначной идентификации элементов информационной модели … создаст основу для перевода нормативно-технических документов в электронный вид».
- «Класс, подкласс1, тип (%%), код класса по КСР, УИН, ADAAB020, 05.1.06.04-1575, KSI160000375» — так по версии Минстроя должен выглядеть единый язык проектировщиков и строителей. Становится понятной интерпретация Минстроем термина «машинопонимаемый». Никто не собирается вычислять знания; собираются перекодировать их на базе языков КСИ и XML.
Беда в том, что специалист не может понять, проверить, а значит, использовать зашифрованные знания.
Единый формат хранения знаний
Вопрос, который нужно решить: как хранить и показывать иллюстрированный текст.
До недавнего времени ответ был очевиден — бумажная технология. Бумага обладает двумя уникальными свойствами:
- хранит информацию в том же виде, в котором ее показывает;
- практически полностью независима и самодостаточна.
С цифровыми технологиями все сложнее. Компьютер хранит информацию в виде нулей и единиц. Для приведения информации в человеческий вид нужно задействовать десятки, если не сотни, программных и технических посредников. Сбой в работе любого посредника приведет к искаженному представлению информации.
Если считать сокращение зависимости от посредников критерием надежности, то ближайшим компьютерным аналогом бумаги будет технология, основанная на показе информации в виде растровых изображений. В простейшем случае для хранения элемента растра требуется всего три числа: координаты пикселя и цветовой код.
Недостатком пиксельных изображений является низкая производительность обработки по сравнению со специализированными форматами. Решением вопроса будет прямое (перед обработкой) преобразование растрового формата в специализированный формат и обратное (перед сохранением) преобразование специализированного формата в растровый.
Маркированный растр
Анализ растровых изображений относится к классу задач распознавания образов. Алфавитный текст довольно надежно распознается программами OCR. Анализ рисунков (пиктографического текста) более проблематичен. Пиктограммы могут располагаться произвольным образом, соприкасаться и накладываться друг на друга. Для облегчения задачи анализа изображений можно использовать тот же метод, что и в языках разметки текстовых документов. Метками (тегами) в этом случае будут пиксели с зарезервированными цветовыми кодами.
В отличие от текстовых маркеров, цветовая маркировка малозаметна и практически не влияет на зрительное восприятие.
Цветовые маркеры считываются при открытии документа, используются в процессе прямого преобразования и добавляются в растр в процессе обратного преобразования при сохранении документа.
Ниже — пример цветовой маркировки пиктограммы в виде полигонального контура.
Рис. 2. Цветовая маркировка пиктограммы
Первый маркер обозначает тип пиктограммы (в данном случае «полигон») и одновременно — начальную точку обхода контура полигона. Маркеры могут быть объединены в цепочку. Второй маркер может обозначать направление обхода контура; третий — тип линии.
Дополнительные маркеры размещаются в характерных точках контура и могут обозначать конечные точки, переломы, разветвления и т. п.
В растровых машиночитаемых документах нет принципиального различия между рисунками и алфавитным текстом. Все можно считать текстом, и все — рисунками (пиктограммами). Например, текст, приведенный ниже, можно рассматривать как рисунок, состоящий из вложенных друг в друга пиктограмм.
Рис. 3. Формализованный растровый текст
С помощью цветовой маркировки задается тип пиктограммы («текст») и ориентация текста. Текст внутри пиктограммы может быть прочитан с помощью технологии OCR.
Вычисление знаний предполагает, что машинопонимаемость обеспечивается не шифрованием, а «улучшением» текста: стандартизацией (в том числе использованием нормативной терминологии), структурированием, устранением смысловых противоречий и неоднозначных интерпретаций.
Заключение: что делать?
Хорошая новость в том, что придумывать ничего не надо. Все придумано, работает, и с каждым годом работает все лучше. Правда, не в области строительства.
- Сделать СтройGoogle — специализированный строительный сервис, объединяющий технологии поиска информации, распознавания образов, обработки естественного языка, машинного перевода.Предметной областью для сервиса будет база знаний из нормативной, справочной, архивной и проектной документации, хранящейся в едином растровом формате.Сервис будет:
- находить документы и фрагменты документов по запросу в виде растровой картинки или текста на естественном языке;
- проверять документы (в том числе чертежи) на соответствие нормативным документам;
- распознавать алфавитный текст и переводить его в машиночитаемые и машинопонимаемые форматы (DOC, XML и т.д.);
- распознавать пиктографический текст и переводить его в машиноисполняемые форматы (DXF, IFC и т. д.);
- на основе контекста автоматически формировать КСИ коды элементов.
- Давно пора сделать замену «автокада». Не очередной клон, а редактор пиктографического текста.
Плохая новость в том, что десять лет потрачено на методологию, которая в настоящее время представляет собой «тонущий корабль, покинутый капитанами». Не исключено, что выгрузка с корабля займет еще десять лет.
Пока все идет как и должно идти, когда сложный неоднозначный вопрос поручено решить чиновникам: бурный прогресс на бумаге; застой и головная боль на местах.
Автор: Александр Ямпольский
Источник: https://isicad.ru/