How to get DataFrame index without RDD conversion?

0

Hi, I'm trying to iterate through the results returned from SelectFields action using the following command

SelectFields_node1656679636429.toDF().index

but i get the following error

AttributeError: 'DataFrame' object has no attribute 'index' it appears that even I convert the DynamicFrame to DataFrame, many attributes are missing. I found a workaround using RDD, and re-inialising a new DataFrame, like below

rdd = SelectFields_node1656679636429.toDF().rdd
df = pd.DataFrame(rdd.collect())
df.index

but this approach seems an overhead. Are there any better, native ways of getting the properly initialized DataFrame from DynamicFrame?

Michael
preguntada hace 2 años64 visualizaciones
No hay respuestas

No has iniciado sesión. Iniciar sesión para publicar una respuesta.

Una buena respuesta responde claramente a la pregunta, proporciona comentarios constructivos y fomenta el crecimiento profesional en la persona que hace la pregunta.

Pautas para responder preguntas