结构化数据指的是关系模型数据,以关系数据库表形式管理的数据,典型场景包括企业ERP、OA、HR等系统中的数据。非结构化数据则是指数据结构不规则或不完整,没有预定义数据模型,难以用二维表表示的数据,如word、pdf、ppt及各种格式的图片、视频等。半结构化数据则是非关系模型、具备基本固定结构模式的数据,如日志文件、XML文档、JSON文档、E-mail等。处理结构化数据时,主要关注数据ETL处理和时效性,包括不同字段映射、新增列、字段转换、三大范式遵守与数据同步时效性。对于半结构化、非结构化数据,由于数据分散,缺乏统一管理,需借助专业工具。处理方式包括提取关键信息至结构化数据、使用专业工具支持数据融合集成以及备份存储文件。提升投入产出比,可使用如FineDataLink这类专业工具,简化数据编排,提高数据使用价值。历史文件备份存储在文件服务器,通过权限管理提供统一入口。资源分享包括处理异构数据的方法与工具,旨在帮助理解与应用结构化、非结构化及半结构化数据处理。