百度研发的深度学习平台 PaddlePaddle 0.15.0 已经发布下载了,支持 Linux 平台。目前PaddlePaddle支持:Ubuntu 14.04/16.04/18.04、CentOS 7/6、MacOS 10.12/10.13、Windows7/8/10(专业版/企业版)。PArallel Distributed Deep LEarning 并行分布式深度学习,PaddlePaddle 具有易用,高效,灵活和可伸缩等特点,为百度内部多项产品提供深度学习算法支持。PaddlePaddle 也是一个易学、易用的开源深度学习框架,能够让开发者和企业安全、高效地实现自己的 AI 想法。
PaddlePaddle 0.15.0主要更新如下 1.主要新功能和优化 PyReader. 支持python自定义数据的读取和预处理,然后发送给带buffer的reader 单机,多机和预测都使用统一的中间表达和转换。 Python3的支持(内测) 预测库更好的symbol隐藏,更好的和其他的依赖库进行隔离。 支持分布式的lookup table。可以支持训练是的大规模稀疏。(内测) 分布式训练的显著稳定性提升和测试覆盖提升。 提高报错信息的可读性。 Profile对分布式的支持和修复 新增算子:mkldnn softmax_grad, squeeze_op, hsigmoid_op, Sampling id, beam_search, flatten_op, rank_loss_op, prior_box_op, bilinear initializer, squeeze/unsqueeze, maxout 对TensorRT支持的扩展,支持更多的TensorRT算子。 持续集成测试系统规模的稳定性的提升 隐藏了大量不应该暴露的public API,增强public API的严谨性。 2.性能 layer_norm前向加速:0.52ms -> 0.16ms (average),反向加速:backward: 1.08ms -> 0.41ms (average) conv_grad mkldnn 加速, fc, gru cpu 上优化。 reduce_sum cpu上4倍提速 softmax_with_cross_entropy提速52.4ms -> 15.6ms OCR CPU模型性能提升,改进im2col实现,增强了conv的执行效率,使得OCR模型在2620v3上取得34.6%的性能提升。 conv2d_transposed_op支持设置Group,并且加速depthwise conv2d_transposed,该加速使得人脸检测模型速度提升16.5% 3.其他 新增第三方库:xbyak, cub, libxsmm 将 libpaddle_inference_api[.a/.so] 合并到 libpaddle_fluid[.a/.so],预测只需要链接 libpaddle_fluid[.a/.so] float16的修复 大幅减少发布的fluid.tgz包大小,gpu版本从730M降低为190M,cpu版本从335M降低为77M,加快用户下载。 4.已知问题 memory_optimize 在分布式的时候会触发bug,我们会在下一个版本修复。
PaddlePaddle主要特性 易用性:为用户提供了直观且灵活的数据接口和模型定义接口。 灵活性:PaddlePaddle支持多种神经网络结构和优化算法。简单书写配置文件即可实现复杂模型,如带注意力机制或复杂记忆连接的神经机器翻译模型。 高效性:为充分发挥多种计算资源的效力,PaddlePaddle在计算、存储、架构、通信等多方面都做了细致优化,性能优异。 可伸缩性:PaddlePaddle全面支持多核、多GPU、多机环境,优化的通信实现使高吞吐与高性能成为可能,轻松应对大规模数据训练需求。
相关链接
安装 推荐在Linux系统下使用最新版的pip快捷地安装和运行PaddlePaddle: 对于需要CPU版本PaddlePaddle的用户:pip install paddlepaddle 对于需要GPU版本PaddlePaddle的用户:pip install paddlepaddle-gpu 注:请确保你的Linux系统版本满足:CentOS 6版本以上,Ubuntu 14.04版本以上。
相关主题 |