• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      OCR識別技術(shù)在鋼結(jié)構(gòu)制造企業(yè)精細(xì)化管理的應(yīng)用

      2023-12-15 07:39:06高天
      中國信息化 2023年11期
      關(guān)鍵詞:工程圖紙文檔鋼結(jié)構(gòu)

      文|高天

      隨著鋼結(jié)構(gòu)制造企業(yè)的發(fā)展和數(shù)字化轉(zhuǎn)型的不斷深入,大量的圖紙和工程文檔成為企業(yè)管理中不可或缺的一部分。然而,傳統(tǒng)的工程圖紙管理和識別過程通常需要耗費大量的人力和時間,且容易出現(xiàn)錯誤。因此本文基于OCR識別技術(shù)將工程圖紙等工程文檔轉(zhuǎn)化為可編輯文本,提供了一種處理大量圖紙的自動化技術(shù)方式,從而實現(xiàn)企業(yè)精細(xì)化管理,提高管理和工作效率。

      一、引言

      (一)鋼結(jié)構(gòu)制造企業(yè)設(shè)計階段中的信息處理現(xiàn)狀

      鋼結(jié)構(gòu)制造企業(yè)在設(shè)計階段涉及大量的信息處理,這些信息涵蓋了從項目規(guī)劃到產(chǎn)品制造的各個方面,其中國內(nèi)鋼結(jié)構(gòu)制造企業(yè)對于信息處理仍大量采用人工處理方式,尤其在鋼結(jié)構(gòu)定額信息化管理方面的研究仍處于起步階段。通過調(diào)研發(fā)現(xiàn)現(xiàn)有鋼結(jié)構(gòu)定額過程中,材料表的提取是定額計算的基礎(chǔ),目前主要采用人工統(tǒng)計完成,存在效率慢、易出錯的特點。

      雖然諸多學(xué)者都對表單的快速提取做了大量研究,但仍有許多關(guān)鍵問題亟須解決,如多張材料單的匯總、材料單的正確率提高、材料單解析并發(fā)量的滿足、文檔解析可視化等問題。南開大學(xué)的尚子峰提出利用OCR技術(shù)實現(xiàn)基于模板的通用表單處理系統(tǒng),該系統(tǒng)模板以XML文檔形式存放。首先該模型不滿足Excel文檔格式的存儲;其次該模型提取表單的正確率較低,約為88%,且不能實現(xiàn)解析結(jié)果的可視化。國防科技大學(xué)任通、程江華等人提出基于OCR技術(shù)的電子掃描表格圖像的自動識別算法,提高了識別的準(zhǔn)確率,但是該方法僅停留在試驗環(huán)境,沒有并發(fā)量的考慮。

      目前鋼結(jié)構(gòu)市場面臨極大的競爭,精益化管理成了行業(yè)共同關(guān)注的主題,如何快速精準(zhǔn)提取大量工程圖紙中的材料表,提高板材的利用率,提高計算效率和降低生產(chǎn)成本,是迫切需要解決的問題。

      (二)OCR識別技術(shù)概況及應(yīng)用前景

      OCR技術(shù)是一種將圖像中的文字轉(zhuǎn)換為可編輯、可搜索的電子文本形式的技術(shù)。該技術(shù)在銀行、保險業(yè)和人工智能領(lǐng)域中得到了廣泛應(yīng)用。銀行和保險公司利用OCR技術(shù)對用戶的身份證、銀行卡等證件進(jìn)行識別并完成相關(guān)操作,提高了業(yè)務(wù)辦理效率和準(zhǔn)確率。在人工智能領(lǐng)域中,OCR技術(shù)能夠提高數(shù)據(jù)的準(zhǔn)確性和處理效率,為機(jī)器學(xué)習(xí)和人工智能提供有力支持。因此利用OCR機(jī)器識別技術(shù)在鋼結(jié)構(gòu)制造企業(yè)也完全可行,利用OCR機(jī)器學(xué)習(xí)技術(shù)、計算機(jī)視覺技術(shù)搭建數(shù)據(jù)解析模型,實現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)到結(jié)構(gòu)化功能關(guān)系的建立,完成從數(shù)據(jù)的識別、解析、抽取、校驗、管理等基礎(chǔ)功能組建的材料表智能提取系統(tǒng)。

      二、智能提取材料表系統(tǒng)設(shè)計

      (一)提取材料表的研究方法

      通過采用智能解析算法,運(yùn)用OCR機(jī)器學(xué)習(xí)技術(shù)、機(jī)器視覺技術(shù)實現(xiàn)PDF文件、圖片、掃描件等非結(jié)構(gòu)化數(shù)據(jù)的批量解析和提取,實現(xiàn)表單解析可視化,實現(xiàn)解析結(jié)果的可追溯性。主要研究方法如下:

      圖像處理和分割:對于圖紙中的材料表,首先需要對圖紙進(jìn)行圖像處理和分割,將材料表從圖紙中提取出來。

      區(qū)域檢測和定位:一旦材料表被提取出來,需要確定表格在圖像中的位置和邊界。

      文字識別:可以使用OCR技術(shù),將表格中的文字內(nèi)容轉(zhuǎn)化為可編輯的電子文本。表格中可能有不同的字體、符號、大小和顏色,需要考慮多樣性。

      模型訓(xùn)練與優(yōu)化:基于機(jī)器學(xué)習(xí)的方法,可以構(gòu)建模型來識別和提取材料表信息。使用標(biāo)注好的數(shù)據(jù)來訓(xùn)練模型,不斷優(yōu)化模型的性能。

      規(guī)則引擎:在一些情況下,可以基于規(guī)則引擎來設(shè)計規(guī)則,例如識別特定格式的單元格,以支持特定類型的材料信息提取。

      驗證與評估:在開發(fā)好的方法和模型中,使用一些真實的圖紙數(shù)據(jù),評估方法的準(zhǔn)確性和效率。

      (二)構(gòu)建智能提取材料清單系統(tǒng)

      該系統(tǒng)主要由非結(jié)構(gòu)化數(shù)據(jù)(PDF文件、圖片)、提取信息系統(tǒng)編程接口、智能解析算法、可視化界面,應(yīng)用功能服務(wù)幾個部分構(gòu)成,如圖1所示。

      圖1 智能提取材料清單系統(tǒng)構(gòu)成

      針對存在的多種非結(jié)構(gòu)化數(shù)據(jù)例如自PDF文件、圖片、掃描件等,運(yùn)用OCR機(jī)器學(xué)習(xí)技術(shù)、智能解析算法實現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的批量解析和提取,提取形式見表1。

      表1 非結(jié)構(gòu)化數(shù)據(jù)的抽取形式

      三、OCR識別技術(shù)在制造企業(yè)圖紙識別中的應(yīng)用

      (一)鋼橋梁制造企業(yè)OCR技術(shù)訓(xùn)練模型集

      本文旨在提高使用OCR技術(shù)識別鋼板材料表計算效率和準(zhǔn)確率,實現(xiàn)鋼結(jié)構(gòu)的成本精細(xì)化管理?;谏疃葘W(xué)習(xí)的OCR算法,實現(xiàn)材料表自動提取的同時,要根據(jù)材料表文件的不同清晰度,實現(xiàn)不同范圍的識別準(zhǔn)確度,確保準(zhǔn)確率,但是考慮到不同設(shè)計圖的命名規(guī)范問題,不能將主要特征作為判定的唯一條件。

      鋼結(jié)構(gòu)制造企業(yè)數(shù)據(jù)主要來自PDF/JPG等不同格式材料文件,這些設(shè)計文檔還包括大量其他信息,其中所需要定額的材料表,一般都存在設(shè)計圖紙中,提供的形式通常為兩種形式:PDF或者紙質(zhì)藍(lán)圖。其中PDF根據(jù)清晰度可以分為三類:AutoCAD直接打印的PDF文件、根據(jù)紙質(zhì)藍(lán)圖掃描成的PDF文件和圖片。

      (二)提取材料表的特征

      為了滿足生產(chǎn)需求,根據(jù)所提供的設(shè)計文檔,需要提取的圖表主要為材料表,材料表的主要特征為:一是材料表的表格名稱(以下簡稱表名)主要特征:“XXX材料表”“XXX數(shù)量表”等關(guān)鍵字;二是表格的列字段(以下稱為表頭)包含編號、規(guī)格、單重、數(shù)量等字段。

      因此,材料表需要提取的內(nèi)容有表格名稱、表格內(nèi)容、規(guī)格列中特殊符號對應(yīng)的鋼材類型、頁碼、梁段名稱等。還要根據(jù)材料表中的小計、合計、總重等字段,結(jié)合合并行單元格的特性來判定匯總數(shù)據(jù)所在的行數(shù),便于進(jìn)行快速核對。

      (三)實際應(yīng)用場景

      目前鋼結(jié)構(gòu)制造企業(yè)提取制造數(shù)據(jù)從工程圖紙定位所需要的材料,整理多種轉(zhuǎn)化后的工程圖紙數(shù)字樣式和不同規(guī)格列表格式,因此每次核對文件通常要上傳成百上千張圖紙。該系統(tǒng)以項目為基礎(chǔ),不同工程圖紙按照項目整合,進(jìn)行OCR集中識別。系統(tǒng)呈現(xiàn)界面顯示從源文檔中切割的圖片和識別后結(jié)果的界面,通過鼠標(biāo)懸浮在指定區(qū)域,進(jìn)行高亮處理,幫助工作人員進(jìn)行線上差錯處理,節(jié)約核對時間。識別結(jié)果均為可編輯文檔,包括在線編輯和下載后編輯,經(jīng)測試該系統(tǒng)識別準(zhǔn)確率高達(dá)95%以上。圖紙識別后界面如圖2所示。

      圖2 圖紙識別后界面

      不同的材料表按照識別出頁碼在平臺內(nèi)進(jìn)行展示,便于工作人員的核對、計算、統(tǒng)計等后續(xù)工作。不同工程圖紙分別保存在各個項目菜單中,材料信息保存到數(shù)據(jù)庫,按照索引方式進(jìn)行收集,方便員工查閱和追溯。隨著系統(tǒng)數(shù)據(jù)的大量積累,為后續(xù)數(shù)據(jù)分析提供有力支撐,為公司精細(xì)化管理提供路徑。

      (四)提升企業(yè)管理水平

      基于OCR的工程圖紙識別定額系統(tǒng)主要通過工作人員進(jìn)行線上數(shù)據(jù)統(tǒng)計,包括材料表提取、核對和導(dǎo)出,顯著提升了管理水平,主要體現(xiàn)在以下方面:①在自動化圖紙?zhí)幚矸矫?,系統(tǒng)可以自動完成很多繁瑣的識別和錄入工作,提高圖紙?zhí)幚淼淖詣踊?,?jié)約時間和人力資源;②在圖紙版本控制方面,對圖紙上的版本號、日期等信息進(jìn)行自動識別,確保使用最新的圖紙版本,避免錯誤和混淆;③在快速搜索與檢索方面,將識別后的圖紙信息存儲到數(shù)據(jù)庫中,可以實現(xiàn)快速的文本搜索和檢索功能,使管理團(tuán)隊能夠迅速找到需要的圖紙和信息。

      四、對企業(yè)精細(xì)化管理的思考與展望

      (一)對制造企業(yè)精細(xì)化管理的思考

      通過進(jìn)一步對OCR技術(shù)進(jìn)行剖析,發(fā)現(xiàn)企業(yè)精細(xì)化管理可更進(jìn)一步。在數(shù)字化檔案管理方面,通過OCR技術(shù),圖紙可以從紙質(zhì)文檔轉(zhuǎn)換為電子文本,并且可編輯、可搜索。在減少錯誤和質(zhì)量控制方面,可減少手工輸入錯誤,提高圖紙?zhí)幚淼臏?zhǔn)確性和質(zhì)量控制水平,有助于預(yù)防錯誤和避免潛在風(fēng)險。通過將圖紙信息數(shù)字化,可以更好地進(jìn)行知識管理和傳承,新加入項目員工可以更容易地訪問和理解過去的項目信息,快速融入項目團(tuán)隊。

      (二)對制造企業(yè)應(yīng)用的展望

      隨著人工智能和計算機(jī)視覺技術(shù)的不斷發(fā)展,未來的OCR技術(shù)可以拓展到更多應(yīng)用場景,制造企業(yè)可以積極探索和應(yīng)用OCR技術(shù)在不同領(lǐng)域的潛力。OCR技術(shù)可以提供更高的集成性,能夠無縫連接到企業(yè)的信息系統(tǒng)和生產(chǎn)系統(tǒng)中,這將有助于實現(xiàn)信息的實時共享和協(xié)作,推動企業(yè)數(shù)字化轉(zhuǎn)型和智能化發(fā)展。OCR技術(shù)作用于數(shù)據(jù)分析與決策支持層面,通過線上收集這些數(shù)據(jù)可以用于進(jìn)行數(shù)據(jù)分析和挖掘,為決策提供科學(xué)依據(jù)。制造企業(yè)通常有自己獨特的業(yè)務(wù)需求,可考慮開發(fā)定制化OCR應(yīng)用,以滿足特定場景的生產(chǎn)和管理需求。

      猜你喜歡
      工程圖紙文檔鋼結(jié)構(gòu)
      基于注意力機(jī)制結(jié)合改進(jìn)動態(tài)ReLU的輸變電工程圖紙智能評審方法
      頂推滑移法在鋼結(jié)構(gòu)橋梁施工中的應(yīng)用
      鋼結(jié)構(gòu)防火設(shè)計規(guī)范及要點探討
      首件鋼結(jié)構(gòu)構(gòu)件確認(rèn)機(jī)制在鋼結(jié)構(gòu)施工中的應(yīng)用
      山東冶金(2022年1期)2022-04-19 13:40:48
      有人一聲不吭向你扔了個文檔
      一種計算機(jī)聯(lián)鎖機(jī)柜工程圖紙的自動化生成方法
      基于RI碼計算的Word復(fù)制文檔鑒別
      Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
      建筑工程節(jié)約型施工現(xiàn)場管理體系的應(yīng)用探微
      不讓他人隨意下載Google文檔
      電腦迷(2012年4期)2012-04-29 06:12:13
      海口市| 肇庆市| 绩溪县| 当阳市| 东丰县| 丹东市| 宁海县| 靖安县| 清丰县| 溧阳市| 宣城市| 安远县| 抚州市| 津南区| 廊坊市| 夏河县| 平武县| 汝阳县| 洪湖市| 台中县| 曲周县| 织金县| 安仁县| 衡阳市| 电白县| 元朗区| 泸西县| 武城县| 金坛市| 贺州市| 三亚市| 西林县| 桐柏县| 晋宁县| 烟台市| 肃北| 成武县| 正镶白旗| 沽源县| 济源市| 利津县|