У меня есть блок искры и кассандра, и я использую разъем cassandra в своих искровых работах. Теперь для выполнения моих заданий я использую spark.cassandra.connection.host и передаю один из IP-адресов семенного узла в одном центре обработки данных. Я проходил через соединительный узел и его состояния, такие какнесколько контактных точек в разъеме искры cassandra
"The initial contact node given in spark.cassandra.connection.host can be any node of the cluster. The driver will fetch the cluster topology from the contact node and will always try to connect to the closest node in the same data center. If possible, connections are established to the same node the task is running on."
Мой запрос - это то, что произойдет, если контактный узел опущен. Spark не сможет получить топологию кластера и, следовательно, не будет работать. Я также использовал nodejs-коннектор для cassandra, и там мы предоставляем массив точек контакта. Возможно ли это в разъёме искры cassandra
Да, но мой вопрос остается без ответа. Итак, что произойдет, если узел, к которому подключается искра, и он еще не обнаружил топологию, я думаю, что он не сможет подключиться и получить данные. – Nipun
Из того, что я понял ... искра не связана с конкретным узел, он подключается к хосту, а затем выбирает узел. Если ваш хост отключен, ваше приложение не будет работать. Если все узлы вашего хоста опущены, приложение перестанет работать. Так что да, если ваш хост выключен, тогда он не сможет получить данные. – dannypaz
В чем разница между хостом и узлом? Acc to the docs «Исходный контактный узел, указанный в spark.cassandra.connection.host, может быть любым узлом» – Nipun