走进青苹果
新闻中心
产品与服务
生产与运营
印前校正
发展规划
30周年纪念
加入青苹果
1. 制作方案的制定
行业方案
青苹果数据中心有限公司成立于1992年。32年来,青苹果始终以文化创意、服务外包、数据库为企业发展方向,致力于青苹果电子出版物的创新发展,争做中国服务外包领军企业。
32年来,青苹果始终以客户第一、质量第一、技术第一为发展原则,现已累计国内外客户超过500家,以图书馆、报社、出版社、传媒机构为主,包括国内外知名的大学、图书馆、互联网企业和政府机构,如中共中央办公厅、人民日报社、清华大学、哈佛大学图书馆、微软、Amazon等。
数据库应用方案
历史报刊数据库、图书文献数据库、多媒体数据库等大型数据库加工一直是青苹果主营业务之一。领先的数据库搭建技术,详实珍贵的内容提供,高度的数据安全保障,标准化的生产流程等一直是青苹果制作大型数据库的坚实基础。时至今日,青苹果生产的数据库已达上百种,包括《人民日报》《光明日报》《申报》等历史报刊数据库;《中国歌曲数据库》《国家大剧院》全媒体演艺资源数据库等多媒体数据库。
青苹果数据库产品功能:
1.全面的数据库浏览功能,包括支持多种检索方式、完善的统计功能、快速导航、多种浏览显示方式;
2.先进的资料维护功能,包括资料下载、子光盘生成、修改资料库、成批导入导出资料;
3.细致的系统管理,包括用户管理、专题生成、统计表格生成;
4.无限开放性和扩展性,包括设置网络共享、开放的数据库、随时扩展数据内容;
5.高度安全性,采用包括用户权限控制、软件注册体系、文本加密、加密狗加密等多种加密方式保证用户数据安全。
生产方案
青苹果成立32年来,始终以高标准、严要求的态度来规范生产流程,为用户提供优质的产品和阅读体验。
扫描识别
青苹果进行文献资料数字化时,首先是对资料进行扫描及图像处理,报纸整版扫描采用600dpi高像素扫描分辨率,保证原版图的高清晰,为信息完成提供基本保证。
对某些特殊资料(如老报纸、善本古籍等)先采用保护手段,然后再扫描,以确保妥善使用资料。
数据录入
在数据录入中,首先是版面分析及定框识别,使用基于清华大学识别系统的专门定制软件,能处理多国文字,识别率处于全国前列。
然后对文字进行校对、修正,采用“双编三较”与横向查错与纵向查错相结合两种生产技术,将文字错误率控制在万分之一以下,重要信息零错误率。
数据处理
录入文本以后,将对数据进行处理,包括利用版面还原技术将版面图像进行智能版面分析,能自动地的恢复100%的版面结构,恢复80%的版面字体字号颜色信息,只有20%的少部份工作需要人工操作。
在此基础上,按照国家新闻分类体系对所有信息进行标引,并可利用其扩展性增加地方特色类目,可使用智能标引技术直接从版面识别结果中自动获取标引内容,获得高质量的数据。
接着是对文本进行造字补字,造字生产工艺除应用超大字库补字外,青苹果有针对PDF缺字的矢量造字工艺,能适应不同计算机文件格式,造字美观。
数据转换
对数据经行处理后,就是最后的对数据进行转换,做成数据库并进行加密处理。
2. 制作方案的执行
技术方案的制定
合同双方认同的技术方案将作为员工的培训手册,使员工熟悉操作方式和技术要求。
样本试生产
成立技术指导小组
建立针对合同项目的技术指导小组。
调整生产管理部门
根据合同项目的特点, 对生产管理部门进行适当的调整,以利于更好的实施生产计划。生产管理部门负责项目生产任务、人力资源,设备资源的分配和协调,管理生产进度和最终产品的数据交接。负责对生产质量的监控和评估。
数据存储和保护措施
1)数据储存的方式
生产部门均采用中心服务器硬盘储存数据,数据实行双备份制。
2)数据的保护措施
专门的数据保管室,具备保安和防火措施;专人从事数据保管;唯一口令开启中心计算机服务器;各部门计算机网络设立防火墙。
生产质量监控
质量监控的核心是对生产流程的监控。结合生产经验及项目特别要求,主要对以下环节进行重点监控, 使其符合统一的质量标准:
1)扫描图像文件命名准确;
2)图像格式符合行业标准;
3)扫描分辨率符合行业标准;
4)色彩处理符合合同技术标准;
5)扫描图像的倾斜度不超过3度;
6)页码完整;
7)页面内容完整;
8)图像位置居中;
9)图像质量清晰;
10)文字误差率<1~3/10,000;
11)版式重构字体选择正确;
12)标引项完整准确。