Вопросы по теме 'google-cloud-dataflow'

Может ли TextIO записывать префиксы, полученные из окна maxTimestamp?
Я обрабатываю оконный поток сообщений PubSub и хочу заархивировать их в GCS. Я бы хотел, чтобы заархивированные файлы имели префикс, полученный из метки времени окна (что-то вроде gs://bucket/messages/2015/01/messages-2015-01-01.json). Возможно ли...
1082 просмотров
schedule 11.01.2024

Преобразование данных в события pubsub
У меня есть конвейер потока данных, который собирает пользовательские данные, такие как навигация, покупки, грубые действия и т. д. У меня есть это требование, чтобы иметь возможность идентифицировать шаблоны в реальном времени, а затем отправлять...
128 просмотров

ошибка записи потока PubSub в облачное хранилище с помощью Dataflow
Использование SCIO из spotify для написания задания для Dataflow , следуя 2 примерам например1 и e .g2 , чтобы записать PubSub поток в GCS , но получить следующую ошибку для приведенного ниже кода Ошибка Exception in thread...
883 просмотров

загрузка в большой запрос с использованием данных сообщения - поток данных google
Я получаю сообщения через pub-sub и хочу загрузить в большой запрос, используя данные сообщения, чтобы определить, в какую таблицу загружать данные. Я пробовал делать следующее: Pipeline pipeline = Pipeline.create (опции); String bigQueryTable;...
50 просмотров
schedule 18.01.2024

Нарушение потока данных вовремя для завершения задания и общее количество часов ЦП с перестановкой с помощью случайного ключа
Я создал поток данных, который принимает входные данные из хранилища данных и выполняет преобразование, чтобы преобразовать его в BigQuery TableRow. Я прикрепляю метку времени к каждому элементу преобразования. Затем к коллекции PCollection...
257 просмотров
schedule 14.12.2023

Максимальный размер шаблона Google Dataflow - 10 МБ
Я установил шаблон в потоке данных Google, и он работал нормально. После некоторой модификации добавления параллельной обработки на раздел размер шаблона стал намного больше. Я попытался запустить его, но ничего не вышло. У меня такая ошибка, как...
486 просмотров

включить другие файлы с потоком данных
В моем потоке данных используется файл .sql . Этот файл содержит запрос и находится в каталоге с именем queries . Мне нужно, чтобы этот файл был загружен с моим потоком данных. То, что я обнаружил, было использованием файла manifest.in, но,...
962 просмотров