Od Przewodnik po programowaniu przesyłania strumieniowego Spark:
Rozszerzając logikę na działanie w klastrze,liczba rdzeni przydzielonych do aplikacji Spark Streaming musi być większa niż liczba odbiorników. W przeciwnym razie system otrzyma dane, ale nie będzie mógł ich przetworzyć.
Czy to oznacza, że jeśli mam 16 rdzeni procesora w całym klastrze Spark, nie mogę odczytać danych z więcej niż 15 tematów Kafka?
Odpowiedzi:
4 dla odpowiedzi № 1Tylko jeśli korzystasz z interfejsu API opartego na kliencie / odbiorcy. Nie dotyczy to Direct Stream.
Spójrz tutaj dla różnic między nimi