仓库常见问题解答

我可以控制哪些数据发送到我的仓库?

是的!对于那些在我们的商业计划,您可以选择数据仓库的源,集合和属性同步。

选择性同步将有助于管理到每个单独仓库发送的数据,允许您将不同的数据集与同一源相同步到不同的仓库。查看有关如何使用选择性同步的更多信息这里

一旦禁用了源,集合或属性,我们将不再与该源同步数据。但是,我们将不会删除仓库中的任何历史数据。重新启用源时,我们将自上次同步以来同步所有事件。注意:如果重新启用集合或属性 - 只有在重新启用集合或属性后生成的新数据将同步到您的仓库时,这不适用。

对于自营服务和免费客户,我们目前不支持选择仓库的manbetx客户端应用下载哪些集合或属性同步。

我们可以添加,调整或删除一些表吗?

您有完整的管理员访问段仓库。但是,不要调整或删除段生成的表,因为这可能会导致我们的系统上传新数据的问题。

如果您想加入其他数据集,请随时创建和上传其他表。

我们可以将旧数据转换或清理新格式或规格吗?

如果您收集的数据随着时间的推移,这是一个常见的问题。例如,如果您曾经追踪该事件注册但现在跟踪注册,您可能希望合并这两个表,使查询变得简单易懂。

Segment无法在您的仓库上下文中更新事件数据,以追溯合并从更改的事件创建的表。相反,您可以创建联合事件的“物化”视图。这在红移,postgres.,雪花等人,但可能无法使用全部仓库。

协议客户也可以使用manbetx客户端应用下载转变更改源上的事件,这适用于所有云模式目的地(从段服务器接收数据的目的地)包括你的数据仓库。协议转换提供了一种极好的方式来快速解决实现错误,并帮助将事件转换为段规范。

请注意:目前的转型目前仅限于事件,财产和特质名称更改,并做不是适用于历史数据。

如何找到我的来源slug?

当您查看源目的地页面或Live调试器时,您的源SLU将在URL中找到。URL结构将如下所示:

//www.asianminres.com/[my-workspace]/sources/[my-source-slug]/overview.

我如何找到我的仓库ID?

当您查看时,您的仓库ID将显示在URL中仓库目的地。URL结构如下所示:

app.www.asianminres.com/[my-warkspace]/warehouses/[my-warehouse-id]/overview.

分段仓库中的数据有多新鲜?

您的数据将在24-48小时内存入仓库。底层的Redshift数据存储在数据新鲜度、健壮性和查询速度之间进行了微妙的权衡。为了获得最好的体验,我们需要平衡这三者。

数据的实时加载到段仓库将在查询时间造成显着的性能下降,因为RedShift使用大批优化和压缩列。为了优化您的查询速度,可靠性和稳健性,我们的保证是您的数据将在24小时内进行红移。

随着我们改进和更新ETL流程并优化下游的SQL查询性能,实际加载时间会有所不同,但我们将确保它始终在24小时内。

您可以使用“同步历史记录”页面查看仓库中数据更新的状态和历史记录。同步历史页面可用于连接每个仓库的每个源。此页面可帮助您回答问题,如“最近已更新的特定来源的数据?”“同步完全失败了,或只是部分失败?”“为什么这同步成功了?”

SYNC历史记录包括以下信息:

  • 同步状态:可能的状态是:
    • 成功:同步运行完成,无需任何通知和所有行同步,或者没有同步的行,因为没有找到数据。
    • 部分的:Sync Run完成了一些通知和一些行同步。
    • 失败:同步运行某些通知,不同步行。
  • 开始时间:同步开始的时间。显示在您当地的时区。
  • 持续时间:这同步所采取的时间长度。
  • 行同步:从SYNC运行成功同步的行数。
  • 通知:找到的错误或警告列表,这可能表明Sync运行的问题。单击通知消息以显示有关SYNC运行中包含的每个集合的任何错误或警告的详细信息。

如果Sync Run显示部分成功或失败,则下次同步尝试同步在先前运行中未成功同步的任何数据。

如果我想向我的仓库添加自定义数据怎么办?

您可以将数据自由加载到段仓库中以加入源数据表。

将您自己的数据加载到连接的仓库中时唯一的限制是您不应在源代码中添加或删除模式生成的模式中的表。这些表有一个命名方案。并且只应按段修改。从这些表中任意删除列可能导致负载时不匹配。

如果要将自定义数据插入仓库中,则创建与现有源无关的新模式,因为可以在群集中的段数据重新加载段数据时删除这些模式。

我们强烈建议您编写脚本,将添加的任何类型的数据存储到仓库中,这样您就不会执行一次性任务,从而在将来发生硬件故障时很难恢复。

我应该白名单吗?

你可以白名单我们的自定义IP 52.25.130.38/32,同时授权段写入到你的Redshift或Postgres端口。

BigQuery不需要白名单IP地址。要了解如何设置BigQuery,请查看我们的设置指南

Segment会同步我的历史数据吗?

当您连接仓库时,我们将自动加载最多2个月的历史数据。

对于完整的历史回填,你需要成为一个细分业务计划客户。如果你想了解更多关于我们的商业计划以及它的所有功能,查看我们的定价页面

您对Postgres推荐什么:亚马逊或Heroku?

Heroku简单的设置和管理过程使其成为快速启动和运行的最佳选择。

亚马逊的服务有一些更强大的功能,对大多数情况来说更划算。然而,第一次使用Amazon Web Services (AWS)的用户可能需要花一些时间来正确地设置文档。

如何防止源代码同步到某些或所有仓库?

在创建新源时,默认情况下,工作区中的所有仓库源同步。您可以通过两种方式阻止源从工作区中的某些或所有仓库同步:

  • 段应用:当您从Workspace Overview页面添加源代码时,取消选择您不希望将源代码同步到的仓库,作为“添加源代码”过程的一部分。默认情况下,自动选择所有仓库。
  • 配置API: 寄一个补丁连接仓库请求更新希望阻止同步的数据仓库的设置。

创建源后,您可以在“仓库设置”页面中启用或禁用仓库同步。

最后更改:2020年7月21日



开始使用细分

段是将网站和移动应用程序数据集成到超过300个分析和增长工具的最简单方法。
或者
创建免费帐户