Tuesday, January 11, 2022

OSCHINA 社区最新专区文章

OSCHINA 社区最新专区文章


Flink 在字节跳动数据流的实践

Posted: 11 Jan 2022 12:38 AM PST

*本文是字节跳动数据平台开发套件团队在1月9日Flink Forward Asia 2021: Flink Forward 峰会上的演讲分享,将着重分享Flink在字节跳动数据流的实践。* ### 字节跳动数据流的业务背景 数据流处理的主要是埋点日志。埋点,也叫Event Tracking,是数据和业务之间的桥梁,是数据分析、推荐、运营的基石。 用户在使用App、小程...

人物 | 陈兴振:58同城机器学习平台资源使用率优化实践

Posted: 10 Jan 2022 01:12 AM PST

2021年10月18~20日,由IT168联合旗下ITPUB、ChinaUnix两大技术社区主办的第12届中国数据库技术大会(DTCC2021)在北京国际会议中心召开,大会以"数造未来"为主题,围绕数据架构、人工智能与大数据应用等内容展开分享和探讨。58同城TEG AI Lab高级架构师陈兴振在人工智能与大数据应用专题下分享了《58同城机器学习平台资...

一场开源 RSA 库引发的“血案”

Posted: 10 Jan 2022 06:02 PM PST

01 导 读 RSA 加密算法是一种非对称加密算法,该算法极为可靠,在现有技术条件下,很难破解,因此在软件开发中被广泛使用。你不必担心,本文不会介绍深奥的 RSA 加密算法,也没有复杂的数学公式。本文将结合 58 iOS App 项目实践,分享一次我们奇异的 Bug 排查经历,谈谈 GitHub 上一个知名的 RSA 算法库 Objective-C-RS...

详解数据中台的底层架构逻辑

Posted: 10 Jan 2022 05:41 PM PST

数据中台到底是什么,几年过去了,也一直众说纷纭。 笔者认为数据中台不应该是一个单纯的系统或者是一个软件工具,而应该是一套架构、一套数据流转模式。 数据中台需要采集数据作为原材料进行数据加工、数据建模,然后分门别类地储存,再根据实际的业 务场景,打造各类数据服务(含数据应用平台)从而实现对业务的赋能加速...

#2021,我们的浮生一日#

Posted: 30 Dec 2021 08:07 PM PST

刷几次行程码,一年就过去了。今天是2021年的最后一天,新冠疫情依然没完没了,时间之轮流转不息。 翻阅过去的这一年,一定有那么一刻的人或事让你记忆犹新。它可能发生在一个排队接种疫苗时充满等待的漫长午后,或是不幸收到失败通知,抑或收获颇丰的日子。 这一周,我们看到了各式各样的年终盘点。也许是受疫情的沉闷氛...

CUDA高性能计算经典问题②:前缀和

Posted: 05 Jan 2022 07:42 PM PST

撰文 | Will Zhang 在 上一篇《CUDA高性能计算经典问题①:归约》 中,我们讨论了CUDA中如何实现高效Reduction,这次来讨论下一个经典问题Prefix Sum(前缀和),也被称为Scan/Prefix Scan等。Scan 是诸如排序等重要问题的子问题,所以基本是进阶必学问题之一。 1 问题定义 首先我们不严谨地定义这个问题,输入一个数组i...

7次KDD Cup&Kaggle冠军的经验分享:从多领域优化到AutoML框架

Posted: 06 Jan 2022 10:59 PM PST

> 反馈快速,竞争激烈的算法比赛是算法从业者提升技术水平的重要方式,从若干行业核心问题抽象出的算法比赛具有很强的实际意义。本文结合笔者在7次Kaggle/KDD Cup中的冠军经验,对于多领域建模优化,AutoML技术框架,以及面对新问题如何分析建模三个方面进行了介绍。希望能够让读者收获比赛中的通用高效建模方法与问题理...

No comments:

Post a Comment